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ПРЕДИСЛОВИЕ 


В книге описываются современные методы оптимизации отдельных 
аппаратов и химико-технологических систем (ХТС). В ней рассмо- 
трены два класса оптимизационных задач химической технологии: 
к первому классу относятся задачи оптимизации ХТС фиксированной 
структуры, ко второму — задачи выбора оптимальной структуры 
ХТС (синтез ХТС). Эти задачи возникают как при интенсификации 
действующих, так и при создании новых химико-технологических 
процессов, в том числе при разработке автоматизированных систем 
управления технологическими процессами (АСУ ТП). Несмотря на 
то, что методы решения задач синтеза ХТС начали развиваться 
в самое последнее время, их разработка стала одной их важнейших 
проблем математического моделирования химико-технологических 
процессов. Решение задач обоих классов должно стать неотъемлемой 
частью создания высокоэффективных химико-технологических про- 
цессов. 

Рост сложности и размерности этих задач, особенно задач 2-го 
класса, требует применения наиболее эффективных (как по быстро- 
действию, так и по надежности определения наилучшего решения) 
методов оптимизации, позволяющих решать эти задачи в реальное 
время. Гибкость и универсальность поисковых методов оптимиза- 
ции, относящихся к классу численных методов нелинейного про- 
граммирования, сделали их основным средством решения задач 
1-го класса и существенной частью алгоритмов решения задач 2-го 
класса. В последнее время такие методы получили большое развитие, 
особенно это относится к квазиньютоновским методам, и к методам 
оптимизации больших систем. Основное внимание в книге уделяется 
этим методам и опыту их использования для оптимизации ХТС. 
Вместе с тем комбинаторная природа задач синтеза ХТС требует 
применения методов дискретной математики, использованию кото* 
рых также уделено большое внимание. 

Авторы выражают благодарность сотрудникам НИФХИ им. 
Л. Я. Карпова и других организаций, оказавшим помощь при под- 
готовке следующих Разделов: «Методы сопряженных направлений» 
(А. Р. Беляевой), «Расчет стационарных режимов химико-техноло- 
гической схемы изомеризации «-пентана» (Н. Н. Зиятдинову и 
В. Б. Покровскому), «Оптимизация процесса полимеризации изо- 
прена в производстве синтетического каучука» (С. Л. Подвальному 
и Е. М. Михайловой), «Расчет отделения синтеза аммиака» (Д. Н. Мо- 
тылю), «Оптимизация конструкционных параметров в теплообмен- 
ной системе» (Г, В- Михайлову и В. С. Виткову). 


УСЛОВНЫЕ ОБОЗНАЧЕНИЯ 


Е п — п-мерное евклидово пространство 
х ь \ рі, ... — г'-тый вектор (вектор-столбец) х; р\ ... 

в последовательности ... или 

і'-тая компонента одиночного вектора х\ 
Р\ ... 

Я г ; Кй ... — і-тая матрица Я; К\ ... 
х і,и - > Уі, ••• — і-тая компонента (координата) 6-го век- 
тора х; у, ... 

Н іі — элемент і-той строки и /-го столбца ма- 
трицы Я = (Ни) 

х т ; Я т ; ... — транспонированный вектор х (вектор- 
строка); транспонированная матрица 
Я : Я = (Ни) Я т = (Н п ) 
я-вектор — вектор из Е п 

(п X т)- матрица — матрица из я строк и т столбцов 
ф ^ Е т , х ^ Е п — (т X я) = матрица 

ЦЛЦ/г — норма Фробениуса (евклидова норма) ма- 
трицы А : ЦЛЦ/г == 2 с?и = Тг (ЛМ) 

/; І п — единичная матрица; единичная (я X я)- 

матрица 

1, « — 1, 2, .... я 
Ѵ а — Для всех а 
3* — существует х 

К} — число обращений к расчету функции / 
К р — число векторов р 
б и — символ Кронекера: б ( у «■ 1, если і ** /, 

&и = 0, если I Ф / 


ГЛАВА I 


Постановка задачи оптимизации 
сложных химико- 
технологических систем 


Современное химико-технологическое производство представляет со- 
бой систему взаимосвязанных аппаратов. Оптимизация отдельных 
аппаратов без учета их связей с остальными аппаратами может при- 
вести к неоптимальной работе всей химико-технологической системы 
(ХТС). Отсюда возникает задача оптимизации всей системы в целом, 
в которой учитывается взаимное влияние аппаратов. Как и при по- 
становке задачи оптимизации в любой другой области, здесь необ- 
ходимо сформулировать математическую модель системы, критерий 
оптимизации и ограничения на переменные. Математическая модель 
ХТС состоит из двух частей — совокупности математических мо- 
делей отдельных блоков и математической модели структуры ХТС. 
Математическая модель отдельного блока имеет вид 


«<*> = /(*>(*(*), «<*>), к = Тй 


(і,і) 


где г 

<>) 


<*> = Ы к) , . 

т к - вектор 




), 


*<*> = (х [ к) , 


„(А) 

К "к 


), 


,<*> = 


(и! 


(А) 


выходных переменных; п к — вектор входных 


переменных, г к — вектор управляющих переменных. Переменные 
г<А), *<а) характеризуют состояние выходных и входных потоков к - го 
блока, а в число переменных включаются конструктивные и 
технологические параметры, изменяя которые можно влиять на ре- 
жим работы к - го блока. Как правило, в число переменных г<*> 
включаются концентрации компонент потока, температура, давле- 
ние и расход потока. Величины х^ к \ часто называют перемен- 
ными состояния, или фазовыми переменными. Здесь, естественно, 
не предполагается известной явная аналитическая зависимость вы- 
ходных переменных от входных и управляющих переменных. Исхо- 
дят только из того, что имеется алгоритм, позволяющий по извест- 
ным входным переменным и управлениям подсчитать выходные пе- 
ременные к-ѵо блока. Так, для определения выходных переменных 
реактора с неподвижным слоем придется решать задачу Коши для 
системы обыкновенных дифференциальных уравнений (а в случае 
учета продольной диффузии — даже краевую задачу) [1, с. 33], 
для определения выходных переменных реактора идеального сме- 
шения или любого аппарата с противотоком (ректификационная 
колонна, абсорбер и т. д.) — систему нелинейных конечных уравне- 
ний и т. д. 
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Рассмотрим теперь математическую модель структуры ХТС. 
Отметим вначале, что потоки ХТС можно разделить на три группы — 
входные, промежуточные и выходные потоки. Входным будем счи- 
тать поток, который подается извне в один из блоков ХТС, выход- 
ным — тот, который выходит из блока ХТС и подается куда-либо 
вне схемы, и, наконец, промежуточным — поток, который выходит 
из одного блока ХТС и подается в другой ее блок. Переменные, 
характеризующие входные, выходные и промежуточные потоки ХТС, 
будем называть входными, выходными и промежуточными перемен- 
ными схемы, соответственно. Далее предположим, что в каждом 
блоке первые $ к ($ к < п к ) входных переменных являются входными 
переменными системы, и первые § к (§ к < т к ) выходных перемен- 
ных — выходными переменными системы. Конечно, в большинстве 
блоков 8 к = § к — 0. Вектор, компонентами которого являются 
входные переменные блока, являющиеся входными переменными 
системы, обозначим через х (к) = (х\ к \ ..., л;^). Для описания 
структуры ХТС пользуются моделями двух типов. В первом случае 
структура ХТС описывается системой соотношений вида 

^ 0 * = 8 * +1 - ' •’"* к=Т ^ (1 ’ 2) 

Такая запись означает, что § к> г я выходная переменная Н к> ( -го 
блока равна /- й входной переменной к-то блока. Эта запись пред- 
полагает, что в разных потоках число компонент может быть раз- 
лично. Соотношения (1,2) характеризуют связи всех входных и 
выходных промежуточных переменных блоков. Рассмотрим мате- 
матические модели структуры ХТС другого вида. Пусть к- й блок 
имеет Ы к входных и М к выходных потоков. Обозначим через х ( * 5 > = 
— (х\ кѣ) , .... х {к ^) вектор переменных 5-го входного потока к-то 
блока и через г {к/) = (г \ кп , ..., г ^. ) — вектор переменных /-го 
выходного потока к-то блока. Математическая модель к-то блока 
может быть теперь записана в виде 

*<*/» = /<*'> (*<“>, . . .,*(***)) / = МЙй (1,3) 


Далее удобно будет считать, что все потоки, т. е. все векторы х <**>, 
г<*/> обладают одними и теми же компонентами. Это, конечно, не 
является дополнительным допущением, поскольку, если в некотором 
потоке имеются не все компоненты, то концентрации отсутствующих 
компонент формально можно считать равными нулю. Отсюда соот- 
ношения связи между блоками могут быть записаны в виде 


N л'ь 

= 22 “Й* ( ' /) (І,4) 

.=і /= і 

Параметры а кі называются структурными и определяются из ус- 
ловия: 


аЙ = 


1, если /-тый выходной поток /-го блока 
подается на 5-й вход &-го блока 
О, в противном случае 


(1,4а) 
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Если і-тый блок будет иметь один выходной поток, а 6-тый блок — 
один входной поток, пользуются более простым обозначением для 
структурных параметров: 

<41 = «« 

В том случае, если каждый блок имеет один входной и выходной 
потоки, соотношения (I, 4) с учетом обозначений (I, 5) примут вид 

хік) = Е % 2<0 Д>6) 

/=і 

Выходной поток любого блока может подаваться только на один 
вход другого блока. Отсюда, если, например а?™ = 1, то а І ч т — О 
для всех к Ф /, 5 ф р. Это условие можно выразить соотношением 


Ж,- 1=0 

в, и 


\,ы я=\ ,м к 


На управления в каждом блоке налагаются ограничения вида 

Ф* (« 4 ) гс: а (4) і (1,8) 

В большинстве случаев они имеют следующий простой вид 

С< '> ^и (к) (1,9) 

где с<*>, — некоторые заданные г ь -векторы. Обычно налагаются 

также ограничения на выходные переменные системы. Для простоты 
записи будем считать, что первые § к (д к < § к ) выходных переменных 
блока фиксированы 

= і = 171* к = 1,Ы (1,10) 

Более сложные ограничения на выходные переменные легко могут 

быть сведены к ограничениям типа (I, 10). 

Для простоты изложения переменные (і = 1, § к ) будем 
иногда называть закрепленными выходными переменными к - го блока, 
а переменные г\ к) (к = § к + 1, ..., % к ) — свободными выходными 
переменными 6-го блока. Иногда имеются также ограничения на 
промежуточные переменные 

ф(х (А) )«=0 (1,11) 

і 1 )( 2 (і >)^0 ( 1 , 12 ) 

В дальнейшем, если не оговорено противное , буд ем предпола гать , 
что все входные переменные схемы х (к) (і = 1, з к к = 1, (V) 

являются свободными переменными, подлежащими определению при 
решении задачи оптимизации ХТС. Эти свободные входные пере- 
менные формально ничем не отличаются от управлений, поэтому те 
и другие иногда будем считать управлениями, вводя при этом обо- 
значения: 


Пусть 


і = 1,з к к = \,Ы 


Г Ч + ч 


Тогда вектор и будет г й -вектором. Критерий оптимизации ХТС 
обычно является аддитивной функцией, зависящей от свободных 
входных и выходных переменных состояния, а также управлений. 
В общем случае он имеет вид: 

к = 1 

где г (к) = (г йк+ і, ..., г йй ) — вектор свободных выходных перемен- 
ных к-то блока; Р <*> — часть критерия, относящаяся к к-му блоку. 
Задача оптимизации ХТС ставится следующим образом. Необходимо 
определить управления и и переменные состояния г<*>, х<*> таким 
образом, чтобы при выполнении уравнений (1,1), (1,2) или (1,3), 
(1,4), а также ограничений (1,8), (1,10) критерий (1,15) принял 
минимальное значение. 


Задача опимизации процесса разделения 
изомеров октана 


Химико-технологический процесс [2], схема которого дана на 
рис. 1, предназначен для выделения компонент А х и А 3 из смеси 
изомеров октана А х — Л 4 . На вход узла разделения подается указан- 
ная смесь изомеров вместе с небольшим количеством углеводородных 
смесей С 7 _ и С 9+ . Входной поток распределяется между блоком раз- 
деления и кристаллизатором. Некоторая его часть может быть на- 
правлена прямо на выход из системы (к бензосмесительной станции). 
Двухступенчатая схема разделения, включающая две ректифика- 
ционные колонны К - 1 и К- 2, предназначена для отделения изомера 
А 3 ." Тяжелые ароматические соединения, собирающиеся в кубе вто- 
рой колонны К- 2, также являются одним из видов товарной продук- 
ции. Дистиллят, отбираемый из первой колонны /С-1 и содержащий 
в основном смесь изомеров октана А ъ А г , Л 4 и углеводородов С 7 _, 
С 9+ , распределяется между кристаллизатором и блоком изомериза- 
ции. Некоторая его часть может быть также выведена из системы 



на бензосмесительную 
станцию. Определенная 
часть дистиллята сме- 
шивается с циркулиру- 
ющим потоком, возвра- 
щаемым из блока изо- 

Рис. 1 . Схема процесса раз- 
деления изомеров октана: 

К- 1 , К>2 — ректификаци- 

онные колонны; С — кри- 
сталлизатор; I — блок изо- 
меризации; Овз — поток на 
бензосмесительную станцию; 
/(?> ^5» ^6* ^ В ~~ потоки соот- 
ветственно остаточного газа, лег- 
ких и тяжелых углеводородов, 
циркулирующей смеси; — 

поток тяжелых углеводородов. 
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меризации и содержащим А у — А 4 , и некоторой долей входного 
потока и подается на вход кристаллизатора. Из верхней части кри- 
сталлизатора отбирается изомер А ъ практически не содержащий 
примесей других углеводородов, а остальная часть нефтепродуктов 
(рафинат), выходящих из кристаллизатора, распределяется между 
блоком изомеризации и бензосмесительной станцией, в которую, 
как было отмечено ранее, может направляться также некоторая 
доля потока, входящего в систему, и часть дистиллята из первой ко- 
лонны /(- 1 . Доля потока из кристаллизатора, направляемая в блок 
изомеризации, на входе в аппарат смешивается с некоторой долей 
дистиллята из первой ректификационной колонны /(-1. 

Для проведения процесса изомеризации в аппарат вводится не- 
большое количество водорода, составляющее 0,5 % общей нагрузки 
аппарата. Получаемые на выходе остаточный газ, легкие и тяжелые 
ароматические соединения представляют собой товарную продукцию, 
а равновесная смесь изомеров октана А г — Л 4 возвращается в цикл. 

Математическая модель процесса * 

Математическое описание системы включает модели ректифика- 
ционных колонн К - 1 и К- 2, кристаллизатора и блока изомеризации, 
а также узлов разделения и смешения потоков. Модели аппаратов 
описываются линейными балансовыми соотношениями. Значения 
индекса і = 1 — 6 присвоим соответственно компонентам потока 
А 1 А 4, С 7 _, Сд + . 

Ректификационные колонны КА, К- 2 . Обозначим через Т кі г 
і-тую компоненту смеси на входе и в дистилляте й-той (й = 1, 2) 
колонны, через В к , і — і-тую компоненту в кубовом остатке й-той 
колонны (к = 1, 2), а через х, у с нижними индексами — соответ- 
ственно входные и выходные величины потоков компонент смеси. 
Так, ут к 1 означает количество і-той компоненты смеси в дистилляте 
й-той колонны, а хт к і — количество /-той компоненты на входе 
в й-тую колонну. Аппараты описываются следующими уравнениями: 

Утк,і = а Ч,і х Тк,і Ув кЛ = х т к>і — у Ткі (1,16) 

где а Тк ., і = 1 — 6, й = 1, 2 — коэффициенты, значения которых 
приведены в табл. 1. 

Кристаллизатор. Введем обозначения: С г — і'-тая компонента 
смеси на входе в аппарат и на выходе из верхней его части; — 
і-тая компонента на выходе из нижней его части; х и у с нижними 
индексами — входные и выходные величины потоков компонент 
для данного аппарата; Ѳ — теоретический параметр процесса кри- 
сталлизации 

Ѳ = 1,0698* с — 1,0758л: с (1,17) 


* Математическая модель и экономические характеристики процесса приведены 
по зарубежной работе [2]. 


Таблица 1 . Коэффициенты й т 


к, і 




Коэффициенты для і — 1 

-6 


к 

1 

2 

3 

4 

5 

6 

1 

ш 

Ш 

ш 

0,9998 



2 

н 

■ 

и 

1 
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где х с — полный входной поток; хс — 2 Хс,- Тогда уравнения мо- 

і=і 1 

дели примут вид: 

і / Сі = 0,8 ( х Сі — 0,075Ѳ) у Сі = 0,005639 ( х Сі — 0,0750) 

у С ' = 0 і — 3 — 6 У%. = х с- — Ус % і = \ ' — 6 (1.18) 

Блок изомеризации. Обозначая, как и прежде, через х и у вход- 
ные и выходные величины потоков, а через Хн г — подачу водорода 
в аппарат Хн 2 = 0,005л:/, гдел:/ — полный входной поток, и прини- 
мая за / с , / г , Іц соответственно остаточный газ, і-тую компоненту 
смеси и смесь изомеров Л/ — Л 4 , запишем уравнения модели в виде: 

г = х і + х н 2 -Уг>- х і, Уі 0 = 0-°25г 

у, = 0,006г + Х/ у І = 0,0042 + Л/ у } — 0,965г (1,19) 

5 5 0 0 Н 

При этом состав смеси в циркулирующем потоке І К полностью 
определен: 

*Ч = °’ 2у 'н у ’щ = °’ 45 % Уі к а =0 ’ 25у 'к *Ч = 0,І % 

(1,20) 

Формулировка задачи оптимизации процесса 

Задача оптимизации заключается в том, чтобы получить максималь- 
ную денежную отдачу от капитальных вложений в данное производ- 
ство за счет перераспределения потоков между аппаратами системы; 
варьируемыми переменными являются х ь і = 1 — 6 — коэффици- 
енты разделения потоков между двумя трубопроводами в точках из 
разветвления. При этом состав смеси, подаваемой в узел разделения 
в количестве х Р , считается заданным: 

х Рі = 0, 18л/? х р г = 0,45 х р 

х р -- 0,11 Хр х Уі 0 , 0 1 Хр 

Приведем выражения для составляющих компонент (затрат), 
с учетом которых формируется в данном случае выражение для 
критерия оптимизации. 
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Хр = 0,23 Хр 


Хр = 0,02 Хр 


( 1 , 21 ) 














Капитальные вложения определяют так: 
для ректификационных колонн 

^ р = 7,4x5^ + 2,3*5^ 

для кристаллизатора (с учетом отчислений) 

^ с = 75у°с 7 +4,5у с (1,22) 

для блока изомеризации (с учетом стоимости катализатора и от- 
числений) 

т 6,4х®’ 7 + 0,06Ху + 50 (1 ,23) 

на тепло-, водо- и энергоснабжение 

= 0,00956* Гі + 0,002775х Гі + 0,441 у с + 0,05х ; (1,24) 

на хранение в резервуарах (расходный бак, хранилище про- 
дуктов Ах и Л 3 ) и трубопроводы 

^ т = 0,2935 ( Хр + Ус + 1// л ) (I ,25) 

6 6 

где х Р — величина входного потока, х т . = I] Хт ,ут ь = I] Ут к 

Я 1=1 Я > * К 1=1 > ‘ 

* = 1 , 2 . 

Дополнительные сторонние вложения вычисляют по формуле: 

У 0 = 0,1 (7,4x0л + 75</°' 7 + 6 + I и + I т ) (1,26) 

Общая сумма капитальных затрат составит 

У=У/?-рУс-р^/-р^ц-р^г + ^0 (1,27). 

Оборотный капитал равен 

Г = 9,75у Гі + 5,25у с (1,28) 

Прибыль представляет собой сумму средств от продажи товара 
за вычетом затрат на его производство. 

Приведем выражения для составляющих этих компонент прибыли. 
Сумма средств от продажи (в расчете на 1 сут) 

5 = 65 у Ті + 30 у с + (26,7у 0 - 8,9 у 0ш ) + 17,9у и + 18,8 ( У/< + у в% # ) + 5,8 у, д 

(1,29) 

где у а, Уа ь , і = 1 — 6 — соответственно величины общего потока 
и потока і-той компоненты смеси, направляемого на бензосмеситель- 
ную станцию. 

Стоимость сырья 

С с = 24,7х р -р 46,9х Ні (1 ,30) 

Заводские затраты (расходы на зарплату, топливо, воду, тепло- 
и энергоснабжение, химические препараты, катализатор) 

С м = 816 + 0,028x^+0,0081x^ + 3,2^ + 1,15х г (1,31) 

Прочие затраты 


О = 0,15У 


Общая сумма затрат 


(1,33) 


С — Сс + Сді + С/ 

Критерий оптимизации в расчете на год (%) 

«/=[100.365(5 — С)]/(7+ И 7 ) (1,34) 

Решение задачи оптимизации должно удовлетворять следующим 
ограничениям: 

у с — Р = 0 (1,35) 

110=5// г 5^274 (1,36) 

2,3 

где Р — заданная величина. Результаты решения этой задачи будут 
приведены в главе IV. 


Математический аппарат решения задач 
оптимизации 

Для решения задач оптимизации химико-технологических процес- 
сов обычно используют методы нелинейного программирования 
(поисковые методы) [1 , 3 ] и методы теории оптимального управления: 
вариационного исчисления [4], динамического программирования 
[5], принципа максимума Понтрягина [6], дискретного принципа 
максимума [7]. Наибольшее распространение получили поисковые 
методы как наиболее гибкие и универсальные. Эти методы находят 
также широкое применение при решении задач идентификации 
(определение некоторых коэффициентов уравнений, представля- 
ющих собой математическую модель исследуемого процесса). Кроме 
того, поисковые методы могут быть эффективно использованы при 
синтезе оптимальной структуры химико-технологических систем, 
который в общем случае представляет собой задачу дискретно-не- 
прерывного программирования; в частности, они могут быть исполь- 
зованы при получении нижних оценок в методе ветвей и границ 
(см. гл. VI). 

Изложению алгоритмов поисковых методов оптимизации химико- 
технологических процессов, их теоретических и практических аспек- 
тов и посвящена эта книга. 

Общая формулировка задачи оптимизации 
и характеристика методов ее решения 

Большое число задач оптимизации химико-технологических про- 
цессов может быть представлено в следующем виде: 

тіп/(х) (1,37) 

х (1 5 

где / — вещественная функция переменной х ^ Е п , 8 с Е п (5 Ф 0). 
Семейство задач на безусловный минимум, методам решения которых 
посвящена глава III, соответствует случаю 5 = Е п в задаче (I, 37). 
Семейство задач минимизации с ограничениями, представляющее 
так называемую общую задачу нелинейного программирования, по- 
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Рис. 2. Классификация методов решения задач минимизации. 


лучается из выражения (1,37), если 5 с Е п определяется системой 
равенств и неравенств 

5 = \х \х ^ Е п , фі (х) = 0 , і'=1, р, % (*Х0, / -= Г?} (Б 38 ) 

Методы решения задач минимизации можно разделить (в извест- 
ной степени условно) на две группы (рис. 2). К первой относятся 
так называемые прямые методы, базирующиеся на непосредственном 
сравнении значений функции в соседних точках, ко второй — не- 
прямые методы, при использовании которых положение минимума 
определяется с помощью соответствующего необходимого условия. 
В дальнейшем всюду речь будет идти лишь о прямых методах реше- 
ния задач минимизации, т. е. о методах «спуска». 

Излагаемые ниже методы носят итерационный характер, т. е. 
представляют собой совокупность определенных вычислительных 
процедур с применением рекуррентных формул, результатом вы- 
полнения которых является построение конечной или бесконечной 
последовательности точек |х г ) ^ Е п , і — 0, 1, ..., позволяющей 
с заданной точностью найти минимум / (х). В методах безусловной 
минимизации, т. е. методах решения задач без ограничений, соот- 
ветствующая последовательность {х*} ^ Е п обладает свойством: 

/ (*о) > [ (*і) > • > тіп / ( X ) 

где / — минимизируемая функция. 

Большинство методов безусловной минимизации предусматривает 
построение последовательности і — 0 , 1 , ... направлений дви- 
жения к минимуму / (х). Основное отличие одного метода от дру- 
гого заключается в способе построения р ь і = 0, 1, ... При этом 
соседние точки последовательности (хЛ связаны соотношением 
(рис. 3): 

х і + 1 = X; + а ірі (1,39) 

где а; — параметр, определяющий длину шага вдоль направления 
Рі, выбираемую некоторым определенным способом. 
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Хі+1 



Рис. 3. Графическое изображение и те рацион- 

ного шага. 


Вектор «сдвига» в направле- 
нии Рі равен 

5і «= А XI = Хі +1 — Хі= а ІРІ (1 ,40) 

Таким образом, выполнение 
одной ((-той) итерации (или шага) 
в конкретном алгоритме спуска за- 
ключается в определении напра- 
вления спуска Рі и точки Хі +і на данном направлении. 

Структуру рассматриваемых далее методов безусловной мини- 
мизации можно представить следующей схемой (рис. 4). 

Шаг 0. Выбирается некоторая начальная точка х 0 ^ Е п и поло- 
жительно определенная ( л X п)-матрица Я 0 . Выполняется расчет 
градиента § 0 минимизируемой функции в точке х 0 : & 0 = § (х 0 ). 

Шаг 1. Даны: точка ^ Е п , вектор градиента = & (х ) 
(п X л) -матрица Определяется направление 


Рі = — Н т е. (1,41) 

I I 

В общем случае вектор направления р ь является некоторой явной 
функцией точки х и предыдущих точек х ( _ и х г _ 2 , ..., векторов гра- 
диентов $і_ ъ ... минимизируемой функции / и матриц О ь О і _ 1 
ее вторых производных, вычисленных в точках х и Хі_ ъ .... т. е. 

Рі = Рі (*г, *і-і, . . 1, . . .; О;, 0,_1, . . .) (1,42) 

В^выражении (I, 42) зависимость р ь от некоторых групп перемен- 
ных, например О г , С;.,, ..., может отсутствовать. 

Если существует явная зависимость от предыдущих точек 
или величин, вычисленных в этих точках, то подобный поисковый 


Шаго\ 


х 0 €Е п , (пхп)- матрица Н 0 >0. 
Вычисляется градиент д 0 ~д(х 0 ) 


Шаги 


Определение направления дбитения: 

Рі = ~Ніді 

(Рі=Рі(хі, х м ,... ; д ь ёі, Ёс-1,4 


шаг2\ 


Стратегия одномерного спуска 
сс і :Г(х і + а і р і )<р(Хі) 

«/=«?: Г(х і + а*р і )^Г(х і ч-с(р і ), )/сС 2*0 


ШагЗ Г 


Вычисляют х^ &1 =х^ +а 4 -р г , 
9і+і = д( х і+і)- Выдирают н і+і 



Выход 


Рис. 4. Структурная схема методов безусловной минимизации. 
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метод называется методом с памятью. Если же вектор направления р г 
явно зависит лишь от величин, вычисленных в точках х и то соот- 
ветствующий метод называется методом без памяти. 

В зависимости от максимального порядка производных, входя- 
щих в выражение (1,42), алгоритмы минимизации относятся соот- 
ветственно к методам нулевого, первого и второго порядков. Напри- 
мер, в методах нулевого порядка предусматривается такое построе- 
ние последовательности \рі], при котором используется лишь ин- 
формация о значениях минимизируемой функции в различных 
точках. 

Существуют алгоритмы минимизации (нулевого порядка), такие 
как симплекс- и комплекс-методы, в которых отсутствует построение 
направлений спуска р,; они достаточно хорошо освещены в литера- 
туре [8, 9] и здесь не приводятся; метод Пауэлла, в котором исполь- 
зуется система сопряженных направлений, рассматривается в ра- 
боте [10], а также [11, с. 121 — 125]. 

В методах первого порядка вектор направления обычно опреде- 
ляется из соотношения (1,41). В этом случае последовательность 
матриц Н 1 определяется характером применяемого метода, причем 
в формировании Н { участвуют производные функции / (х) не выше 
первого порядка. Методы второго порядка допускают зависимость //* 
в выражении (I, 42) от вторых частных производных минимизируе- 
мой функции. Например, классический метод Ньютона соответствует 
выбору Н[ = С] 1 , т. е. 

Р. = -0-'е (В43) 

I І І 

Вектор р ь і = 0, 1, ... обычно определяет направление «спуска», 
т. е. убывания функции / ( х ). Это означает, что производная функции 
/ (х) по направлению отрицательна 

д( (Хі) 

~~д Рі = Р Я і = - 8і Н і«і < 0 (I -44) 


Достаточным условием выполнения этого условия является по- 
ложительная определенность матриц Н ь в этом заключается не- 
отъемлемое свойство целого ряда обсуждаемых ниже алгоритмов. 
Шаг 2. Рассматривается функция одной переменной 

Л И = / (*і + а Рі) (1,45) 

и выбирается величина а ь определяющая шаг по направлению р ь 
и удовлетворяющая условию: 

/ (хі + сс,Рі) </ (х^ (1,46) 

и некоторым другим требованиям. Например, если дополнительное 
условие для сс г имеет вид 

/(*і + “іР«)=5г/(*г+«Рі) уа>0 (1,47) 


то говорят о точном нахождении минимума функции / (х) в направ- 
лении р { . Соответствующее а, будем обозначать а-, а точку х,- + 
+ с іірі назовем оптимальной в направлен ии /7^ -В некоторых слу 
чаях полагают а і ----- сопзі, 

* Госудаэотжишіія 
? публичная библиотек. 

I ми. ВТ. Белинского 


> Пц р ц і пиек 


I 



еті^оряе^я условие (1,46). 

17 


Шаг 3. Рассчитываются точка х 1+1 = + а ,р г и (в градиент- 
ньіх методах) вектор д і+1 = д ( х і+х ), а затем формируется матрица 
п і+1 . В зависимости от результата проверки условия остановки ра- 
бота алгоритма либо прекращается (в этом случае х і+1 с требуемой 
точностью является оптимальной точкой), либо осуществляется пе- 
реход к шагу 1 ( і -> і + 1). Условием окончания работы алгоритма 
обычно является неравенство |& +1 |<в, где е> 0 — заданное 
число, или | [ (л: г - +1 ) — / (х г ) | <С е. Используются также и другие 
условия окончания, например \х і+1 — х { I < ё вместе с Ід,^І<е 

И Т. Д. 1 ' ’ 

Пример алгоритма, обладающего подобной структурой, пред- 
ставляет классический метод наискорейшего спуска (метод Коши), 
соответствующий выбору в выражении (1,41) Н г = І п , і = 0, 1,' 
.... где І п — единичная ( п X л)-матрица. Направлением движения 
здесь является наискорейшее убывание функции в данной точке: 

Рі = —ёі і = 0 , 1 ,... ( 1 , 48 ) 

Точки Хі перехода на следующее направление определяются 
с помощью условия (1,47), т. е. а с = а*. 

Характерная особенность этого метода — простота реализации; 
однако общеизвестны и его недостатки: метод является линейным — 
даже при минимизации квадратичной функции процесс поиска ее 
минимума теоретически бесконечен; для функций с сильно вытяну- 
тыми линиями уровня (изолиниями) процесс поиска носит явно вы- 
раженный зигзагообразный характер и дает слабое продвижение 
к минимуму; точное определение минимума практически нереально. 

Среди алгоритмов решения задач с ограничениями прежде всего 
следует отметить методы последовательной безусловной миними- 
зации (см. главу IV). Возросший интерес к этим методам связан, 
по-видимому, с появлением в последнее десятилетие достаточно эф- 
фективных квадратичных методов безусловной минимизации. Суть 
методов последовательной безусловной минимизации, как известно, 
заключается в построении на основе минимизируемой функции и 
функций ограничений некоторого семейства функций, зависящих 
от параметров. Определяется безусловный минимум (или экстремум) 
каждой функции этого семейства при фиксированных значениях 
параметров. Оказывается, что при некоторых условиях последова- 
тельность полученных решений задач без ограничений сходится 
к решению исходной задачи при определенном изменении параметров 
семейства функций. 

Анализ поисковых методов показывает, что в них используются 
следующие основные алгоритмы (процедуры): 

1) расчет целевой функции; 

2) расчет производных; ^ " 

3) линейный поиск по данному направлению; 

4) выбор матрицы Я; 

5) учет ограничений. 

Алгоритмы 3, 4 и, как правило, алгоритм 5 характеризуют стра- 
тегию поиска. 
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Вследствие большой размерности, трудоемкости задач оптими- 
зации ХТС требуется высокая эффективность перечисленных основ- 
ных алгоритмов поисковых методов. Рассмотрим их с этой точки 
зрения. 

Известно, что расчет критерия оптимизации сводится к расчету 
статического режима системы [3, с. 13]. Повышение эффективности 
алгоритмов расчета статических режимов процессов достигается 
применением эффективных методов решения систем нелинейных 
уравнений, а также использованием методов структурного анализа 
[1, 3]. Методы решения систем нелинейных уравнений будут по- 
дробно рассмотрены в главе II. 

Производные критерия оптимизации по варьируемым перемен- 
ным определяются либо аналитически, либо с помощью разностей: 

д/ М*і х к + Ах к х п )—і(х 1 ,...,х к ,...,х п ) ^__ 1 „ (! 49) 

Важнейшую роль в повышении эффективности поисковых ме- 
тодов играют собственно алгоритмы стратегии поиска (алгоритмы 3, 
4, 5). Принципам построения эффективных алгоритмов стратегии поис- 
ка уделяется в данной книге основное внимание. Главными критерия- 
ми оценки эффективности методов минимизации являются необходимая 
для реализации и работы алгоритма память вычислительной машины, 
быстродействие алгоритма и надежность определения минимума. 

Память, необходимая для реализации алгоритма, зависит от 
типа используемой ЭВМ, избранного алгоритмического языка про- 
граммирования, от искусства программирования. Память, необ- 
ходимая для работы алгоритма определяется, в основном, длиной 
используемых массивов, зависящих от п — размерности задачи. 

Для оценки быстродействия алгоритмов минимизации введем 
следующие обозначения: т^, х в , % а — время, затраченное соответ- 
ственно на вычисление значений минимизируемой функции / (х), 
расчет градиента § (а), работу собственно алгоритма (сумма + 
+ % ё + т а составляет общее время работы алгоритма при решении 
конкретной задачи). Для реальных задач всегда выполняется ус- 
ловие: 

Та«Х/ + Т й (1,50) 

Так как пропорционально общему числу вычислений функции 
К (/), а т $ ~ К р — числу направлений спуска (предполагается, 
что алгоритм линейного поиска по направлению требует расчета 
лишь значений минимизируемой функции в различных точках, а не 
ее градиента), то быстродействие градиентных алгоритмов миними- 
зации определяется числами /(/ и К р , которые будут в дальнейшем 
указываться при решении тестовых примеров и конкретных задач. 
Если производные определяются разностным методом, то общее 
число вычислений функции равно 

К = К* + Крп (1,51) 

Качественные оценки надежности и быстродействия алгоритма 
обычно определяются по результатам минимизации известного на- 
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бора тестовых функций. Для большей части излагаемых алгоритмов 
в соответствующих местах книги приведены таблицы с этими резуль- 
татами. Если это специально не оговаривается, производные тесто- 
вых функций вычисляются аналитически. Кроме того, для крат- 
кости в графах «функция» таблиц приведены порядковые номера 
тестовых функций, соответствующие приложению 1, а /* и |§* 
обозначают величины / и |§| в конечной точке х*. 

В заключение следует отметить, что в книге рассматриваются 
только детерминированные локальные методы поиска. Методам 
случайного поиска посвящена книга [12 ]. Методы глобального поиска 
рассматриваются в работе [13, с. 491—525]. Таким образом, в даль- 
нейшем предполагается, что либо множество 5 выпукло и / (х) 
выпукла на 5, т. е. / ( х ) имеет в 5 единственный минимум, либо на- 
чальное приближение выбрано достаточно близко от минимума. 

Подходы к задаче оптимизации на основе 
выбора поисковых переменных 

Будем исходить из предположения, что ограничения на выходные 
переменные системы имеют вид (I, 10), а ограничения (I, И), (I, 12) 
на переменные состояния отсутствуют. Обозначим через х' , т! со- 
ответственно векторы промежуточных входных и выходных пере- 
менных всех блоков схемы, через 2 — вектор закрепленных [см. 

1 (Е Ю)] выходных переменных всех блоков схемы, через г вектор 
свободных выходных переменных всех блоков, являющихся выход- 
ными переменными схемы, через и вектор управлений всех блоков 
ХТС. Векторы х', г' будут т-векторами, вектор г— ^-вектором, 
вектор г — (§ — ^-вектором, вектор и — л-вектором, где 

N N N N 

т =Ті (т к -5 к ) г = У] гь (1,52) 

*=• *=1 &=1 А =1 

Тогда совокупность систем уравнений (1,1) для всех блоков системы 
может быть записана в виде: 

(г’.х'.и) = г' — /' (х’,и) =0 (1,53) 

г|)(г, х\ и) = г — /(*', «) = 0 (1,54) 

(г, х' , и) = г — 7 (•*', и) = 0 (1,55) 

где через /' обозначен вектор правых частей соотношений (I, 1), 
соответствующих промежуточным переменным всех блоков системы, 
через ! вектор правых частей соотношений (I, 1), соответствующих 
закрепленным выходным переменным всех блоков ХТС, через 7 век- 
тор правых частей соотношений (I, 1), соответствующих свободным 
выходным переменным всех блоков ХТС. 

Совокупность соотношений связей для всех блоков системы 
имеет вид: 

— г' = о (1,56) 
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Предположим, что ограничения на управления заданы в форме не- 
равенств (I, 9). В новых обозначениях совокупность этих ограниче- 
ний может быть представлена следующим образом: 

и^йі Ох = {и: с^.и^.Ь} (1,57) 

В новых обозначениях ограничения (I, 10) запишутся так: 

2 — а=0 (1,58) 

Используя введенные обозначения, запишем критерий оптимиза- 
ции (I, 15) 

Р = Р(и, і) (1,59) 

Подставляя в (I, 59) значение г из (I, 55), приведем критерий к сле- 
дующему виду: 

Р(х',и)=Р(и,7(х',и)) (1,60) 

В сформулированной выше задаче оптимизации имеются переменные 
следующих трех типов: 

х', и, г' (1,61) 

При постановке любой задачи оптимизации часть переменных 
(I, 61) (в частном случае все) принимаются в качестве поисковых 
(независимых), а часть — в качестве зависимых. Поисковыми, или 
независимыми, называются переменные, в пространстве которых 
ведется поиск минимального значения критерия (I, 15). Зависимыми 
переменными являются те из переменных (I, 61), которые на каждом 
шаге процедуры оптимизации, т. е. при каждом вычислении крите- 
рия (I, 15), определяются с помощью систем (I, 53), (I, 54), (I, 56) 
или их частей для заданных значений независимых переменных. 
При этом та часть системы (I, 53), (I, 54), (I, 56), которая исполь- 
зуется для определения зависимых переменных, будет автоматически 
удовлетворяться на каждом шаге оптимизации, уравнения же остав- 
шейся части системы (I, 53), (I, 54), (I, 56) необходимо считать огра- 
ничениями типа равенств и учитывать с помощью методов условной 
минимизации. Метод решения задачи оптимизации ХТС существенно 
зависит от того, какие из переменных (I, 61) будут взяты в качестве 
поисковых, а какие — в качестве зависимых, какие из уравнений 
(I, 53), (I, 54), (I, 56), (I, 58) будут удовлетворяться автоматически 
на каждом шаге оптимизации, а какие необходимо считать ограни- 
чениями типа равенств в соответствующей задаче на условный экс- 
тремум. 

Рассмотрим варианты выбора поисковых переменных. 

Поиск в пространстве управлений. В этом случае в качестве 
поисковых берутся переменные и, а переменные х ' , г' считаются 
зависимыми, определяемыми на каждом шаге оптимизации из си- 
стемы уравнений (I, 53), (I, 56) при заданных значениях поисковых 
переменных и. Если подставить в уравнение (I, 53) вместо г' вектор х' 
[в соответствии с (1,56)], то получим систему уравнений 


і))', (х', и) = х' — /' ( х ', и) = 0 


(1,62) 
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( 1 , 63 ) 


ч 

С учетом уравнения (I, 54) соотношения (I, 58) примут вид: 

а—! (л/, и) = О 

Соотношения (I, 63) принимают во внимание двумя способами. 

При первом способе их считают ограничениями типа 
равенств, которые налагаются на поисковые переменные и и должны 
учитываться с помощью методов условной минимизации. В этом 
случае задача оптимизации ХТС выглядит следующим образом 
(задача 1 ): 

тіп ? (и, х') = 0 (1,64) 

4 3 ' (*',“) = 0 (1,65) 

«6^2 А = {и : а —/(*', и) = 0} (1,66) 

Итак, поиск ведется в пространстве переменных и\ при каждом фикси- 
рованном значении и переменные х' находят из системы уравнений 
(1,65) [см. выражение (1,62)]. 

После того как определены переменные х' , переменные г' просто 
находятся из выражения (I, 56). Таким образом, на каждом шаге 
оптимизационной процедуры уравнения (I, 65) автоматически удо- 
влетворяются, и с помощью методов условной минимизации необ- 
ходимо учитывать только ограничения (I, 66). 

При втором способе учета ограничений (I, 63) их 
включают в число уравнений, которые автоматически удовлетво- 
ряются на каждом шаге оптимизационной процедуры. Таким обра- 
зом, число уравнений, которым удовлетворяют переменные м, х ' , 
возрастает на величину ц [см. выражение (I, 52)] по сравнению 
с предыдущим случаем. На такую же величину должно возрасти 
число зависимых переменных, с помощью которых должна удовлетво- 
ряться система уравнений (I, 62), (1,63). Предположим, что послед- 
ние 8 к (з к < 5 Й ) управляющих переменных в каждом блоке, т. е. 
часть свободных входных переменных блока [см. выражение (I, 13)] 
будут включены в число зависимых переменных. Введем обозначение 

N 

* = Ц Ч (1,67) 

й=1 

Тогда должно существовать равенство 

*= 8 

Обозначим через й вектор, компонентами которого будут 
и \ ^ 1 = 1,.. ., г^, г^-\- 1 , . . • , + 5 ^ — к — 1 , N 

а через и — вектор, компонентами которого будут 

и с к) *='* + **- 3 * + і--.'* + ®* (1.70) 
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( 1 , 68 ) 

( 1 , 69 ) 


Тогда независимыми окажутся переменные й, а зависимыми — пере- 
менные х', и и задача оптимизации ХТС формулируется следующим 
образом (задача 2)\ 


тіп Р (и, х') 

й 

(1,71) 

ф' (х г , и, м) = 0 

(1,72) 

1 

*-«* 

К 1 

II 

о 

(1,73) 

и €7) і 

(1,74) 


В данном случае запись вектор-функций ф', ? отличается от записи 
при формулировке задачи 1 [см. выражения (1,65), (1,66)] тем, 
что здесь отражено разбиение вектора и на два вектора: й, и. Итак, 
поиск ведется в пространстве независимых переменных ы; при каж- 
дом фиксированном значении й зависимые переменные х ' , и нахо- 
дятся из системы уравнений (I, 72), (I, 73). Таким образом, на каж- 
дом шаге оптимизационной процедуры автоматически удовлетворя- 
ются уравнения (I, 72), (I, 73), и с помощью методов условной мини- 
мизации необходимо учитывать только простые ограничения (I, 74). 

Решение системы уравнений (I, 1), (I, 2) [или эквивалентной ей 
системы (I, 53), (I, 54)] при фиксированных значениях управляющих 
переменных и является по существу расчетом стационарного режима 
ХТС (расчетом материального и теплового баланса системы). Для 
простоты будем называть решение системы (I, 65) расчетом системы. 
Решение же системы (I, 72), (I, 73) является по существу расчетом 
системы при одновременном удовлетворении некоторых граничных 
условий. 

Решение системы (I, 65) иногда называют моделирующим расче- 
том схемы, а решение системы (I, 72), (I, 73) — проектным расчетом 
схемы. 

Поиск в пространстве управлений и переменных состояния. 

В этом случае независимыми являются переменные х' , ы, а зависи- 
мыми г'. Для определения г’ будут использоваться уравнения (I, 56). 
Исключив переменные г' из выражения (I, 53) с помощью (I, 56), 
получим систему уравнений (I, 62). Задача оптимизации ХТС за- 
писывается следующим образом ( задача 3): 

т'тр (и, х') (1,75) 

х‘,и^0 3 (1,76) 

йз = [х’, и : х' — /' (х', и) 0 , ? (х' , и) — а = 0 , и^Бі} 

Следовательно, поиск ведется в пространстве переменных х ' , и 
а с помощью методов условной минимизации необходимо добиваться 
удовлетворения как системы (I, 62), так и системы (I, 63), которые 
во время поиска рассматриваются как ограничения типа равенства. 

В ряде случаев в качестве независимых переменных удобно 
выбрать управления и и часть переменных состояния х'\ тогда за- 
висимыми переменными будут оставшаяся часть переменных х’, 
а также переменные г'. Обозначим через х' вектор зависимых пере- 
менных состояния, а через х" — вектор независимых переменных 
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состояния. Так же как и во всех предыдущих случаях, исключив 
переменные г' из уравнений (I, 53), с помощью уравнения (I 56) 
получим систему (I, 62), которую запишем в виде: 

х' — ]'(х'‘~х'и) = 0 (1,77) 

х'-7'(х',х',и)=0 (1,78) 

где через 7 обозначена часть вектора функции соответствующая 

переменным х , а через [' — часть вектора /', соответствующая пе- 

ременным х . Система уравнений (I, 77) будет автоматически удо- 
влетворяться на каждом шаге оптимизационной процедуры, а урав- 
нения системы (I, 78) будут считаться ограничениями типа равенств, 
которые должны учитываться с помощью методов условной мини- 
мизации. В этом случае задача оптимизации ХТС выглядит следу- 
ющим образом ( задача 4): 

шіп Р (и, х' , х') ( • 79) 

и 7х' 


х' — Г (х ' , х', и) = О 


(1,80) 


и, _ (1,81) 

= {и, х' :и€0ь а — /(*», и) = 0, и) = 0} 

Итак, в данном случае поиск ведется в пространстве переменных 
и, х'\ при, каждом фиксированном значении переменных и, х' пере- 
менные х находятся из системы уравнений (I, 80), а ограничение 
(I, 81) удовлетворяются с помощью методов условной минимизации. 
Преимущества и недостатки сведения задачи оптимизации ХТС 
к сформулированным задачам будут рассмотрены нами в гл. IV 
после изучения методов условной и безусловной минимизации. 
Здесь мы только отметим, что в большинстве случаев задача опти- 
мизации ХТС сводится либо к задаче 1, либо (реже) к задаче 4. 

Дадим схемную интерпретацию перехода от задачи 1 к задаче 3 
или 4. Пусть в начале задача оптимизации ХТС сформулирована 
как задача 1 . Выберем в качестве независимых переменных помимо 


управлений ы<*>, (к — 1, V) также входные промежуточные пере- 
менны Хі , (і = Зр + 1, ..., гг») р-то блока. В этом случае из си- 
стемы уравнений (I, 53), (I, 56) или эквивалентной ей системы 
(I, 65) [либо (I, 62)], которая автоматически удовлетворялась при 
каждом оптимизационном шаге (шаге второго уровня), исключается 
совокупность уравнений 


ѵ(Р> _Д.< 


= 0 


І = 4- 1 , . . . , п 

р‘ р 


(1,82) 


и переносится в совокупность уравнений, которые удовлетворяются 
с помощью методов условной минимизации. Поскольку соотношения 
(I, 82) характеризуют все потоки, которые подаются на вход к - го 





N 1 — >о— 


Рис. 5. Схема последова- 
тельности блоков с рецик- 
лом, ' 
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Рис. 6. Разомкнутая схема, 
соответствующая схеме, 
приведенной на рис. 5. 



блока, исключение соотношений (I, 82) из системы (I, 53) эквива- 
лентно разрыву всех входных потоков р-го блока. 

Итак, со схемной точки зрения выбор входных промежуточных 
переменных р - го блока в качестве независимых переменных экви- 
валентен разрыву всех входных потоков р - го блока. При этом вы- 
ходные переменные блоков, потоки из которых подаются на вход 
р-го блока, становятся свободными выходными переменными схемы 
(зависимыми переменными). Следовательно, переход от задачи- 1 
к задаче 3 может быть представлен таким образом: разрываются 
все входные потоки всех блоков схемы, при этом входные промежуточ- 
ные переменные блоков схемы становятся поисковыми (независимыми) 
на уровне задачи оптимизации, а выходные промежуточные пере- 
менные блоков становятся свободными выходными переменными 
схемы (зависимыми переменными). 

При переходе от задачи 1 к задаче 4 разрывается только часть 
потоков. Иногда этот прием называют вынесением соотношений 
связи в критерий [1 1 , с. 181 ]. На рис. 5 приведена схема с рециклом, 
а на рис. 6 — соответствующая разомкнутая схема, полученная 
при выборе входных переменных 2-го блока в качестве независимых. 


Г Л А В А II 

Расчет стационарных режимов 
химико-технологических систем 


Пусть химико-технологическая система состоит из N блоков. Для 
простоты записи будем исходить из предположения, что каждый 
блок имеет один входной и один выходной поток размерности т. 
В отличие от формы математической модели, принятой нами при 
постановке задачи оптимизации ХТС [см. выражение (I, 1)], запи- 
шем математическую модель к - го блока в более общем виде 

Ф<*> («(*>, ш<*>, к (А >) = О (III) 

где ’ 

® < ‘ ) = («’і‘ ) №) = 

т векторы, характеризующие соответственно входной и выходной 
физический поток; — г й -вектор управляющих переменных бло- 
ков (в данной главе будем считать его заданным): и ^ = (и^\ 
Ф (ч (ф,“> «•) — вектор левых частей системы (II, 1). 
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Модель (II, 1) относительно выходных переменных записана 
в неявном виде, поскольку для ряда аппаратов (реактор идеального 
смешения, абсорбер и др.) выходные переменные действительно 
являются неявными функциями входных переменных. Выражение 
(II, 1) представляет собой систему из т уравнений с 2т неизвест- 
ными. Если задать любые т чисел или или часть перемен- 
ных ѵ и часть то, вообще говоря, система (II, 1) позволяет 
найти остальные т чисел. В дальнейшем, в отличие от физических 
входных и выходных переменных блока введем расчетные 
переменные: входные х (при расчете блока считаются известными) 
и выходные (получаются в результате расчета блока). Это свя- 
зано с тем, что при расчете схемы направление расчета блока не 
всегда совпадает с направлением физических потоков, входящих 
и выходящих из блока. Иногда выбор того или иного направления 
расчета блока может существенно упростить его расчет [3, с. 24]. 

Соотношения связи блоков записывают следующим образом: 

N / N \ 

ѵ {к) = 2 « кР> ш 2 а « = 1 I к = ПѴ (11,2) 

/= і \*=і / 

Если расчетные входные и выходные переменные блоков вы- 
браны, то математические модели блоков описывают выражениями 
(I, 1), а соотношения связи — равенствами (I, 6). В частном случае 
модель 6-го блока может быть линейна: 

2 (*) _ Д(*)д;<*) в ( к ) (П,3) 

В дальнейшем блок-схему химико-технологического процесса 
будем называть технологической, если направления ее потоков 
совпадают с направлениями физических потоков, и информацион- 
ной, если направления ее потоков совпадают с направлениями 
расчета блоков. 

Рассмотрим два типа расчетов — моделирующий и так называе- 
мый проектный. 

Моделирующий расчет. В этом случае все входные переменные 
схемы и управляющие переменные блоков считаются заданными, 
а выходные переменные схемы — свободными, так что задача расчета 
стационарного режима системы сводится к решению системы из 
2(Ѵт нелиней ных у равнений (II, 1), (II, 2) с 2 Мт неизвестными 
ѵ (к) , (6=1, Ы). Различают два подхода к расчету схем — мо- і 

дульный [14, с. 15 — 18] и ориентированный на уравнения [14, 
с. 23]. При модульном подходе к системе уравнений (II, 1) любого 
блока ХТС подходят как к неразделимому целому, другими словами, 
не разрешается обрабатывать отдельные уравнения системы (II, 1). 

Это значит, что блок начинают рассчитывать только, когда задан 
любой набор из т переменных у (А) , ш<*>, после чего одновременно 
вычисляют оставшиеся т переменных. При применении ориентиро- 
ванного на уравнения подхода уравнения всех блоков ХТС соби- 
раются в единую систему уравнений, каждое из которых может 
обрабатываться отдельно. Это значит, что по заданным всем (или 
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части) компонентам вектора разрешается рассчитывать одно или 
несколько тѵ\ к \ или наоборот. При модульном подходе возможны 
совместный (параллельный) и последовательный методы расчета 
ХТС. В свою очередь параллельные методы делятся на одноуровне- 
вые и двухуровневые [15, 16]. При одноуровневом параллельном 
методе расчета все переменные и ш (А) считаются итерируемыми, 
и мы должны решать систему из 2 А/т нелинейных уравнений (II, 1), 
(II, 2) с 2 А/т неизвестными о (А >, (к = 1, Л/). В том случае, когда 
в каждом блоке определены расчетные входные и выходные перемен- 
ные, выходные переменные блоков могут быть исключены. Действи- 
тельно, подставив в равенство (I, 6) уравнения (I, 1), получим си- 
стему из А/т уравнений 

N 

Р (х) = - % а кі р (Д/>, и</>) = о к = Т7ы (11,4) 

/=і 


относительно N = тN неизвестных лг<4 (к — 1, Л/). 

При двухуровневых параллельных методах все переменные 
ц(*) ( также считаются итерируемыми, при этом на 6-том шаге 
итерации проводится линеаризация моделей (II, 1),для чего использу- 
ется их специальный вид. После этого система уравнений (II, 1), (II, 3) 
становится линейной и ее решают одним из известных методов. В ре- 
зультате решения мы получаем новую точку, в которой опять про- 
водится линеаризация моделей и т. д. Часто эти методы оказываются 
весьма эффективными. Однако они не универсальны, поскольку 
обычно в них используют специальный вид моделей блоков (II, 1). 

Рассмотрим последовательный метод расчета. Он применяется 
к информационной блок-схеме. В связи с этим необходим этап пре- 
образования технологической блок-схемы в информационную. В про- 
стейшем случае информационная блок-схема строится таким образом, 
что направления информационных потоков совпадают с направле- 
ниями соответствующих физических потоков. Однако при рацио- 
нальном выборе направлений потоков иногда удается либо умень- 
шить размерность решаемой системы нелинейных уравнений, либо 
вообще перейти к безытерационному расчету. 

После построения информационной блок-схемы переходят к вы- 
бору итерируемых переменных; в качестве таковых берут не все 
переменные г ( *>, как при параллельном методе, а только часть. 
Для определенности будем исходить из предположения, что в ка- 
честве итерируемых выбраны компоненты некоторой совокупности 
векторов 

* (А) (6 = Рі Р ,) «<А/ (11,5) 

Совокупность векторов (II, 5) обладает тем свойством, что разрыв 
потоков, соответствующих этим векторам, превращает замкнутую 
схему в разомкнутую. 

В дальнейшем разрываемые потоки будем называть особыми, 
а схему, полученную разрывом особых потокое — соответствующей 
разомкнутой схемой. 
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После того, как переменные (II, 5) выбраны, расчет ХТС сво- 
дится к решению некоторой системы нелинейных уравнений вида: 

х =~Р( х ,и) (11,6) 

где х — вектор размерности п = тз, компонентами которого яв- 
ляются все компоненты векторов (II, 5); вектор Р (х, и) = [р, (х, и) 
..., г п (х, и)\. При заданных значениях х , и вектор р (х, и) опреде- 
ляется расчетом соответствующей разомкнутой схемы [1 с 30] 
Аналитический вид функции Р (х, и) нам неизвестен. Иногда систему 
(II, о) удобно представить так: 

/(*,«) = 0 [/ (х, и) = х — р (х, и)] (II, 7) 

Проиллюстрируем различные подходы к расчету ХТС на примере 
простои последовательности блоков с рециклом (см. рис. 5). В случае 
параллельного расчета в качестве итерируемых переменных могут 
быть взяты либо все входные *<*> (к = 1, А) и выходные 2 <*> (к = 
= 1, А) переменные блоков, либо только входные переменные Рас- 
смотрим теперь последовательный метод расчета. Пусть направления 
потоков в информационной схеме совпадают с направлениями физи- 
ческих потоков. В этом случае вид информационной блок-схемы 
также соответствует схеме, приведенной на рис. 5. В качестве ите- 
рируемых могут быть взяты, например, переменные х< 2 > (либо пере- 
менные, соответстнующйё любому потоку, связывающему блоки 1 
..., А). Соответствующая разомкнутая схема приведена на рис. 6.’ 

В настоящее время в большинстве случаев применяется модуль- 
ный последовательный метод расчета ХТС. В связи с этим все даль- 
нейшее изложение будем вести применительно к этому методу (если 
не будет оговариваться противное), называя его для простоты по- 
следовательным методом расчета ХТС. 

Р асчет * Остановимся коротко на проектном рас- 
чете ХТС. В этом случае уравнения математической модели ХТС 
дополняются уравнениями, выражающими ограничения на выход- 
ные переменные ХТС, и полученная система уравнений решается 
совместно. Пусть ограничения на выходные переменные имеют 
«ИД и- Тогда уравнения (I, 10) добавляются к системе (I, 1), 

(I, 2) или к эквивалентной ей системе (II, 7). Поскольку число урав- 
нений увеличилось на величину § [см. выражение (I, 52)], на 
столько же должно увеличиться число неизвестных, куда дополни- 
тельно должны быть включены д управляющих или входных перемен- 
ных схемы (при моделирующем расчете они считались заданными). 
Для определенности будем считать, что в число неизвестных вклю- 
чаются управляющие переменные (I, 13) (часть свободных входных 
переменных ХТС), причем соблюдается равенство (I, 68). Первый 
путь решения полученной системы нелинейных уравнений состоит 
в организации двухуровневого расчета, когда на первом уровне 
решаются уравнения (II, 7) при фиксированных значениях перемен- 
ных (I, 13), а на втором идет такой подбор переменных (I, 13), при 
котором удовлетворялись бы условия (I, 10). Подобный принцип 
проектного расчета принят во многих системах программ моделиро- 


вания ХТС, например в работе [19]. Ясно, что при этом на первом 
уровне проводится моделирующий расчет ХТС. Второй путь 
состоит в организации одноуровневого расчета, когда одновременно 
решается система уравнений (II, 7), (I, 10) относительно неизвестных 
хм и [см. формулы (I, 13) ]. В этом случае в информационную блок- 
схему искусственно вводятся дополнительные обратные связи; по- 
дробнее об этом см. в работах [1, с. 28; 30]. 

Заметим, что моделирующий расчет ХТС соответствует решению 
системы (I, 62) при фиксированных значениях управлений и , а про- 
ектный решению систем (I, 72), (I, 73) относительно переменных 
х' , и при фиксированных значениях переменных й. 

Итак, расчет стационарного режима ХТС сводится к решению 
некоторой системы нелинейных уравнений. Поэтому все дальней- 
шее изложение будет посвящено методам решения систем нелинейных 
уравнений. Заметим, что имеется определенная специфика решения 
систем нелинейных уравнений при использовании последователь- 
ного подхода. Действительно, при заданном х мы не можем рассчи- 
тать отдельно левую часть одного или нескольких уравнений системы 
(11,7), рассчитать их можно только вместе. Это не позволяет исполь- 
зовать методы, в которых предусмотрена обработка каждого уравне- 
ния системы (II, 7) в отдельности (например, метод Гаусса — Зейделя 
[20, с. 345] в случае линейных систем, метод Брауна [21 ] в случае 
нелинейных систем). 

Методы решения систем нелинейных уравнений можно разбить 
на три группы. К первой относятся метод простой итерации и его 
модификации, а также методы, ускоряющие сходимость простой 
итерации (методы О ЕМ [22], ОБ ЕМ [23]); ко второй — метод 
Вольфа и его модификации [3, с. 35; 1, с. 84]; к третьей — квази- 
ньютоновские методы. Здесь мы рассмотрим только метод Ньютона 
и квазиньютоновские методы решения систем нелинейных уравне- 
ний, идейно очень близкие к методу Ньютона и квазиньютоновским 
методам оптимизации. Ь дальнейшем будем говорить, что метод 
обладает р-шаговым свойством линейного окончания, если он обеспе- 
чивает решение системы линейных уравнений при числе шагов, не 
превышающем р. - . 

Отметим, что к задаче решения систем нелинейных уравнений 
помимо расчета стационарных режимов ХТС сводится и ряд других 
важных задач в химической технологии — например, расчет проти- 
воточных аппаратов (ректификационные колонны, абсорберы, тепло- 
обменники и др.), поэтому она является одной из наиболее распро- 
страненных вычислительных задач в химической технологии. 

Метод Ньютона 

Пусть необходимо решить систему нелинейных уравнений 

/(*) = 0 ( 11 , 8 ) 

где /, х — п-векторы. Обозначим через х } (/' = 1 п, ...) после- 

довательность точек, полученных при использовании метода Нью- 
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тона. Элементы вектора лу будем обозначать через х и (і = 1, я). 
Разложим в точке х ] левую часть системы уравнений (II, 8) в ряд 
Тейлора и оставим члены порядка малости не выше первого 


/ (X] + Алу) ~ / (*;) + АХ] (11,9) 

где матрица Якоби системы функции /; Ах — приращения, 
которые получают переменные х на г-том шаге метода Ньютона. 
Введем обозначения: 

І} = Нхі) Уі = / 7+1 - - !і з} = х иі — хі (іі,Ю) 

и найдем величины Алу. Для этого приравняем правую часть равен- 
ства (II, 9) нулю, считая точку х і+1 корнем уравнения (II, 8) в ли- 
нейном приближении: 

^^Аx^ = — /у (11,11) 

отсюда имеем 

Ах, = -ф, ( 11 , 12 ) 

Чтобы найти следующее приближение 

х і+і — х і + Ах] (11,13) 


необходимо определить вектор Ллу либо как решение системы ли- 
нейных уравнений (II, 11), либо с помощью матрицы, обратной 
матрице Якоби [см. выражение (II, 12)]. Для повышения стабиль- 
ности метода следующее приближение часто находят с помощью 
соотношения 

Х і +1 = ХіЛ-ѵ-іРі (11,14) 

где а у скаляр, а вектор р } определяется либо решением системы 

уравнений 

1т — и (II ,15) 

либо с помощью соотношения 

(11,16) 

Вектор р, равен ньютоновскому шагу в /-той точке. Ясно, что $, =■ 
■» а#). Введем обозначение 

*/ = "(*/)”]/!/?/ (II. 17) 

Тогда параметр выбирается либо из условия 

а; = агб тіп N (х } + ар]) (11,18) 

либо из условия 

Мм<Ы ) (11,19) 

Легко показать, что метод Ньютона позволяет находить решение 
системы линейных уравнений за один шаг. Действительно, пусть 
выражение (II, 8) является системой линейных уравнений, т. е. 

?(х) = Ах + Ь = 0 (11,20) 

где А — невырожденная п X п-матрица; Ь — п-вектор. 
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Решение этой системы имеет вид х* = — Л _1 Ь. Поскольку 


то 


Дх/ А 1 (Ах у = — X] — А г Ь 

*і = х 0 — * 0 — Л _1 6 = — Л 1 /? 


Преимущества и недостатки метода Ньютона применительно к за- 
даче оптимизации рассмотрены в работе [11, с. 268]; остановимся на 
наиболее существенном недостатке. Метод Ньютона требует опреде- 
ления матрицы Якоби — левых частей системы уравнений (II, 8). 
В случае расчета стационарных режимов ХТС аналитическое опре- 
деление матрицы Якоби обычно требует очень трудоемкой подготови- 
тельной работы. Конечно, положение изменится, когда будут созданы 
системы программ моделирования ХТС, использующие математиче- 
ский аппарат «сопряженного процесса» [1, с. 139], позволяющий 
вычислять требуемые производные. Однако, поскольку таких про- 
грамм, полностью автоматизирующих аналитическое определение 
матрицы Якоби, пока еще нет, метод Ньютона с аналитическим вы- 
числением производных применяется очень редко. В связи с этим 
ставится задача использования метода Ньютона с некоторой аппро- 
ксимацией матрицы Якоби. Наиболее простым способом получения 
аппроксимации матрицы Якоби является разностный. В этом случае 
элементы } кр матрицы подсчитываются следующим образом: 

^ ( Хіі ' ■■■’ х рі + . . . , х П [) — іы (хц, ■ ■ . , х ѵ і , .... хп і) ... 0І 

іьр (11,21) 


В методе Ньютона с разностной аппроксимацией матрицы Якоби 
можно выделить два этапа на каждом шаге — это сбор информации 
для построения аппроксимации матрицы Якоби и собственно поиск. 
На первом этапе поочередно даются приращения всем аргументам 
функции / (х), причем функция / ( х ) вычисляется в (п + 1) точках, 
и вычисляются элементы матрицы Якоби с помощью уравнения 
(II, 21). Второй этап — это собственно поиск, при котором в начале 
определяется направление поиска с помощью выражения (II, 15), 
а затем делается шаг в этом направлении. Благодаря тому, что эти 
два этапа разделены, на каждом шаге приходится вычислять функции 
/ (х) в (п + 1)-й точке. В этом заключен большой недостаток метода, 
особенно существенный, когда размерность системы (II, 8) велика. 


Квазиньютоновские методы 


Основной идеен квазиньютоновских методов является объединение 
этапов сбора информации и поиска. Причем информация, которую 
получают во время поиска, используется для построения аппрокси- 
мации В; матрицы Якоби либо аппроксимации Я 7 - матрицы, 
обратной к матрице Якоби. По аналогии с соотношениями (II, 15), 
(II, 16) направление поиска определяется либо решением системы 
линейных уравнений 

Вт = -іі ( 11 , 22 ) 

либо с помощью соотношения 

Рі = - Н)Ъ 


( 11 , 23 ) 
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/и^Іі^п Щая точка итерации определяется с помощью формулы 
(11, 14). Преимущество аппроксимации обратной матрицы Якоби 
состоит в том, что в этом случае не нужно решать систему линейных 
уравнении. Однако аппроксимация самой матрицы Якоби имеет 
свои преимущества, которые мы обсудим ниже. Конечно, информа- 
ция относительно функции / (х), получаемая во время поиска и ис- 
пользуемая для построения матриц В ; , Н и должна быть достаточно 
«качественной». Ясно, что если точки поиска х } достаточно долго 
будут находиться либо в гиперплоскости, либо в близкой к ней 
окрестности, то построить аппроксимацию матрицы Якоби будет 
трудно. Можно отметить некоторую аналогию с методами активного 
и пассивного эксперимента в теории планирования эксперимента. 
В методах активного эксперимента для построения математической 
модели объекта используются специальные возмущения, наносимые 
на объект. Для построения же математической модели с помощью 
методов пассивного эксперимента оперируют данными нормальной 
эксплуатации объекта. 

Найдем соотношения, которые должны удовлетворять матрицы 
Ш И іпѵ ' Перепишем соотношение (II, 9), используя обозначения 

■ г і*і = Уі ( 11 , 24 ) 

Итак, в линейном приближении матрица Якоби удовлетворяет 
равенству (II, 24). Потребуем, чтобы матрицы В] +1 удовлетворяли 
соотношению, которое аналогично тому, которому удовлетворяет 
сама матрица Якоби [24] 

В}+і ѵ = (11,25) 

Выпишем^ соотношение (II, 24) для всех предыдущих точек, начиная 
с нулевой х 0 , ..., Х]_ г (/ < л). При этом предположим, что точки 
х о> •••> х і-і находятся вблизи решения системы (II, 8) и что в его 
окрестности эта система близка к линейной. При этом предположе- 
нии элементы матрицы Якоби можно считать постоянными, не за- 
висящими от номера точки. Отсюда равенства (II, 24) для / = О 
1 і — 1 (і < п) примут вид 

-І 3 1 = Уі / = 0, 1 , * — і (11,26) 

Матрицы Ѵі, 8 і размерности л X і введем следующим образом: 

у і = (У» 5,- = ($„,. ... 5,-.і) (И, 27) 

Тогда совокупность систем уравнений (II, 26) будет эквивалентна 
следующему матричному уравнению: 

^ 8 ^ = У^ і^п (11,28) 

Можно потребовать, чтобы на і-том шаге искомая матрица В,- удо- 

влетворяла уравнению 

ВіЗі = Ѵі і^п ( 11 , 29 ) 

которое аналогично уравнению (II, 28). В системе линейных уравне- 
нии (II, 29) при і < п число неизвестных (элементы матрицы В ; ) 
больше числа уравнений, при і = п оно становится равным числу 
уравнений. Далее будет показано, что в случае линейных систем 
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определение матрицы Ві из уравнения (II, 29) обеспечивает решение 
этой системы на (п + 1)-м шаге. Это, собственно, и оправдывает 
введение этого уравнения. В случае нелинейных систем матричное 
уравнение 

в і^і = Уі і>п 


уже не имеет решения, поскольку число неизвестных в нем меньше 
числа уравнений. Способы продолжения процедуры решения при 
і > п будут обсуждены ниже. 

Рассмотрим теперь случай, когда строится приближение к об- 
ратной матрице Якоби. Из (II, 24) имеем 

^ х Уі = 3 і (П,зо) 

Потребуем, чтобы приближение И / ;_і к матрице удовлетворяло 

условию 

и і+іУі = 5у (11,31) 

Ьсли потребовать, чтобы матрица Н ь удовлетворяла соотношениям 

(11, 31) в і предыдущих точках, начиная с нулевой, то по аналогии 
с уравнением (II, 29) можно получить следующее матричное урав- 
нение для определения Н ( [25; 26]: 


нуі = 5, 

Процедура определения матрицы 
ниже. 


і П 

Ні при і > п будет 


(11,32) 

обсуждена 


В дальнейшем соотношения (II, 25), (II, 31) будем называть 
квазиньютоновскими условиями 1-города. Со- 
ответствующие методы, в которых матрицы В и Н ь удовлетворяют 
этим условиям, будут называться квазиньютоновскими 
методами 1-го рода. Соотношения (II, 29), (II, 32) будем 
называть квазиньютоновскими условиями 2-го 
рода, а соответствующие методы — квазиньютонов- 
скими методами 2-го р о да. Будем говорить, что ква- 
зиньютоновский метод обладает глубиной памяти а если 
в (* + О-й точке матрицы В к+1 , Н к+1 должны удовлетворять ква- 
зиньютоновским условиям в с/ предыдущих точках: 


Вк+і&і = Уі <? ^к]=к, к — 1 ,. к — < 7 + 1 ( 1 1 , 33 ) 

н к-аУі = аі <7<А/ = А„ к— 1,..., А — <7+ 1 (11,34) 

Таким образом, квазиньютоновские методы 1-го рода являются 
методами с глубиной памяти, равной 1, и для построения матрицы 
Якоби (обратной матрицы Якоби) в (/ + 1)-й точке они используют 
только информацию в данной точке [векторы 8) , Уі в соотношениях 
( 11 , /О), (П, Л1))^ ь то же время для построения матриц В, Я, 
методы с глубиной памяти ц используют и предыдущую информацию. 
Методы 2-го рода отличаются тем, что глубина памяти а увеличивается 
в них на 1 на каждом шаге (при і < п). 

Рассмотрим частный случай, когда система (II, 8) является си- 
стемой линейных уравнений (II, 20). Условия (II, 24) в данном слу- 
чае запишутся в виде: у 


А$і = у і 


2 Островский Г. М. 


/ = 0, п — 1 


(11,35) 
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а уравнения (II, 29) — в виде: 

А5і=Ѵі (П,36) 

или 

8 І = А- 1 Ѵ І (11,37) 

Для вывода квазиньютоновских методов здесь будут использо- 
ваны вариационные методы и аппарат псевдообратных матриц. 

Квазиньютоновские методы 1-го рода 

Вначале найдем приближение В иі к самой матрице Якоби. Удобнее 
искать матрицу В і+1 в виде 

Виі = В } + Е (11,38) 

где В, известна из предыдущей итерации, а матрицу Е требуется 
найти. Подставив 5 У - +1 из формулы (II, 38) в соотношение (II, 25), 
найдем, что матрица Е, содержащая п 2 элементов е и , должна удо- 
влетворять следующему матричному уравнению: 

Е$і = Гі (11,39) 

где 

г 1 = Уі — В]В] (11,40) 

Полученное выражение эквивалентно п линейным уравнениям. 

Таким образом, число неизвестных превышает число уравнений. 
Имеющимися степенями свободы мы можем воспользоваться, вы- 
брав элементы матрицы Е наилучшими с точки зрения какого-либо 
критерия. Очень важен выбор критерия, который, с одной стороны, 
должен приводить к хорошей сходимости метода, а с другой, обеспе- 
чивать не слишком большую сложность получающихся методов. 
В последнее время в качестве такого критерия используется минимум 
нормы Фробениуса матрицы Е [27; 28]: 

н^ = 21 23 е ?/ амо 

<=і і=і 

Возникает вопрос — почему взят такой критерий? Можно ли строго 
доказать, что надо использовать именно этот критерий, а не другой? 
На это может быть дан только один ответ — отрицательный: не может 
быть строгого обоснования выбора в качестве критерия нормы Фро- 
бениуса. Однако в качестве обоснования обычно приводят следующие 
качественные соображения. Минимизация критерия (II, 41) обеспе- 
чивает наименьшее из возможных изменение матрицы В і при нало- 
жении некоторых дополнительных ограничений, т. е. использование 
такого критерия обеспечивает максимальную близость матрицы В ;+1 
к матрице В Отсюда, если В 3 обладала какими-либо хорошими 
свойствами (например, была близка к матрице Якоби), то матрица 
В ]+1 должна в какой-то степени их сохранить. Конечно, приведен- 
ные рассуждения ни в коем случае не являются строгим обоснова- 
нием выбора критерия (II, 41). Единственным действительным обос- 
нованием может служить эффективность тех алгоритмов, которые 
могут быть получены на основе этого критерия (11,41), т. е. только 
вычислительная практика. Не исключено, что практика подскажет 
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другой критерий, который даст возможность получать более эффек- 
тивные методы. Здесь имеется некоторая аналогия с естественными 
науками, где на основании практики часто выдвигается та или иная 
гипотеза, следствия которой проверяются практикой же. 

В дальнейшем назовем принципом наименьшего 
изменения матрицы В і способ определения матрицы 
Дн-і из условия минимума нормы Фробениуса при наличии каких- 
либо дополнительных условий, зависящих от конкретной задачи. 

Займемся теперь определением вида матрицы Е. Согласно ска- 
занному выше, ее элементы ец должны находиться из условий выпол- 
нения соотношения (II, 39) и минимума критерия (II, 41). Матема- 
тически эта экстремальная задача запишется следующим образом: 


гпіп-і-ІІ Е ||р 

е и * 

(11,42) 

Би, = г } 

Перепишем эту задачу в координатном виде: 

(П,43) 

™} П '^г%% е2 а 23 = Гк.і 

(П,44) 


’и * і=і/=і /=і 


Для ее решения воспользуемся методом множителей Лагранжа. 
Функция Лагранжа будет иметь вид: 


1 = . 


-Л Чіі 


к = 1 1 = 1 


с кІ~Г и е кІ 8 1,І 

к = 1 1=1 


где к к множители Лагранжа. Приравнивая производные Ь по 
е ір нулю, получим 

е ір — ^ і 8 р,} 

Отсюда легко проверить, что имеет место матричное соотношение 

Е = ~Ц (11,45) 

где к — вектор с компонентами ..., к п . 

Для определения к подставим это выражение для Е в уравнение 

(II, 43), откуда найдем к — — /у/(з/5/); следовательно, матрица Е 
будет иметь вид 

г,$] 

Е = - 77 - (II ,46) 

Подставляя выражение для Е в (II, 38) и используя (II, 40), получим 


Д 7+х = Д/ + 


(Уі ~ в ЕіУі 


8 і 8 ! 


(11,47) 


Получим теперь выражение для аппроксимации обратной матрицы 
Н і+1 . Известна формула Хаусхолдера [24] 


(Л + сда т )" 1 — Л' 1 — 


А 1 ш т А~ 1 


(П, 48) 
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где А — невырожденная (п X я)-матрица; ѵ, т — (п х 1)-матрицы. 
Непосредственная проверка дает возможность с легкостью убедиться 
в правильности этой формулы. Полагая ѵ = = $ 7 - и 

применяя формулу (11,48) к выражению (II, 47), после несложных 
преобразований получим: 


Н і 


■ Ні 


(V 


Н і у і) & 1 Н ! 


в )Н у. 

1 I я і 


(П,49) 


Это известное преобразование Бройдена, которое из иных сообра- 
жений было получено в работе [24]. Отметим ряд свойств метода 
Бройдена. 

1- е свойство. В работе [29] показано, что метод Бройдена 
[см. выражения (II, 13), (II, 23), (II, 49)] позволяет находить реше- 
ние системы линейных уравнений порядка п при числе шагов, не 
превышающем 2 п. При этом следует отметить, что если вместо фор- 
мулы (II, 13) используется формула (II, 14), то метод Бройдена 
теряет это свойство. 

2- е свойство. При использовании метода Бройдена для 
решения системы линейных уравнений (11,20) норма матрицы 


с і+ 1 : 


А ~ в і+і 


(П,50) 


характеризующая ошибку аппроксимации матрицы А матрицей В і , 
не возрастает с увеличением /. Действительно, подставим в урав- 
нение (II, 47) значение г/ 7 - из условий (II, 35), а результат подставим 
в формулу (II, 50); тогда после несложных преобразований получим: 


'/-и 


( А ~ в і) 


*і 3 / 


5 -5- 
ГУ 


(11,51) 


Известно, что ( п — 1) собственное значение матрицы 


Іп 




в / 8 / 


(11,52) 


равно единице, а одно равно нулю [24]. Матрица (II, 52) является 
симметрической, поэтому ее норма равна максимальному собствен- 
ному значению [20, с. 330], т. е. единице. Но норма произведения 
двух матриц меньше или равна произведению их норм [20, с. 328]. 
Отсюда норма матрицы С і+1 меньше или равна норме матрицы С,-. 
Следовательно, с увеличением /' норма матрицы С } [не возрастает. 
С другой стороны, доказательства, что С, -*■ 0, а следовательно, В) 
стремится к матрице А, нет. Отсюда следует, что для эффективной 
работы метода Бройдена требуется, чтобы в качестве В 0 использо- 
валось хорошее приближение к матрице Якоби. Это объясняет, 
почему обычно в качестве В 0 используется разностная аппроксима- 
ция матрицы Якоби в начальной точке. Вообще говоря, в качестве В 0 
может быть использована и единичная матрица, однако опыт пока- 
зывает, что эффективность метода при этом существенно ухуд- 
шается [30]. 


3-е свойство. Если матрица Я, вырождена, то и все после- 
дующие матрицы Н к (к > і) будут вырожденными. Докажем это 
свойство по индукции: пусть Ні вырождена; это значит, что ранг 
ее м еньш е п и существует ряд линейно независимых векторов д } 
(/ = 1. Р ), для которых справедливо равенство 

Н іЩ = 0 (11,53) 

Пуст ь (? линейное подпространство, натянутое на векторы дц 
(І = 1, р)- Ясно, что если д ^ С}, то 

н іЯ^ О (Ц,54) 

Умножив справа обе части равенства (11,49) на д ^ <2 и исполь- 
зуя (II, 54), получим 

Н і+І ч = 0 (11,55) 

т. е. матрица Н і+1 также является вырожденной. Отсюда следует, 
что начиная с точки і, все последующие направления поиска будут 
лежать в подпространстве ( }, ортогональном подпространству < }, 
Действительно, пусть д 0., тогда р]д = — ГіНід = 0 и направ- 
ление поиска рі будет ортогонально любому вектору, принадлежа- 
щему ф. Аналогично доказывается, что и все последующие векторы р к 
(к > і) будут принадлежать подпространству С}. Отсюда, между 
прочим, следует такой практический вывод. Если во время поиска 
матрица Ні по каким-либо причинам станет вырожденной, то все 
последующие направления поиска будут лежать [в некотором под- 
пространстве. Следовательно, и предельная точка также будет 
лежать ,в этом подпространстве. Поскольку маловероятно, чтобы 
истинное решение системы (II, 8) лежало в этом подпространстве, 
то в этом случае будет найдено неправильное решение. Это же свой- 
ство, по-видимому, объясняет следующее явление, наблюдающееся 
при использовании метода Бройдена. Часто случается, что после- 
довательные приближения X) изменяются 'крайне медленно. По-ви- 
димому, это связано с тем, что в процессе поиска матрицы Я 4 стано- 
вятся близкими к вырожденным, и направления поиска лежат 
вблизи некоторого подпространства, хотя решение не принадлежит 
этому подпространству. Поэтому очень важно принимать меры, 
препятствующие вырождению матрицы Ні во время поиска. 

ь заключение характеристики метода Бройдена отметим, что 
описанные первые два его свойства, а также эффективное примене- 
ние этого метода для решения разнообразных прикладных задач 
являются косвенным оправданием выбранного критерия (II, 41). 

Заметим, что аппроксимация Ні может быть получена не через 
матрицу В и а непосредственно, в результате применения принципа 
наименьшего изменения матрицы Я^. Действительно, введем обо- 
значение 

Н і+\ = Н і+° (11,56) 

Тогда элементы матрицы Я будем искать таким образом, чтобы ее 
норма Фробениуса была минимальна и при этом выполнялись ус- 
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ловия (11,31). Задача определения матрицы Б запишется в этом 
случае следующим образом: 

П П 

т ' т ХЕ 4 (П .57) 

ё а і = і н і 


ОУі = щ 


(11,58) 


где т і = 5] — Н]У]. Действуя совершенно аналогично 
мулы (II, 47), легко получить 


и 




:Н. 


(' 5 / 


■ н ,»,)у] 


УіУі 


выводу фор- 

СН, 59) 


Если сравнить формулы (II, 59) и (II, 47), то можно увидеть, что 
в них поменялись местами векторы 5 ; - и у,. Применение формулы 
(11,59) показало, что она работает неудовлетворительно [24]. 
В то же время практическое применение формулы Бройдена (11,49) 
для решения разнообразных прикладных задач показало ее большую 
эффективность. 


Получим выражение для В } при условии, что в качестве критерия минимизации 
будет использована норма Фробениуса некоторой взвешенной матрицы 

У = ІГгіГ (11,60) 

где \Ѵ , Й7 — произвольные невырожденные (п X л)-матрицы. Итак, матрицу Е 
ищем в данном случае как решение задачи 


формулы (11,60) имеем 


тіп 

|І ггг \\ Р 

(П,61) 

л іі 




ЕЗ] = г] 

(П,62) 

Е = 


(11,63) 


Подставим в выражения (11,61), (II. 62) значение Е из формулы (11,63), при этом 
мы перейдем к новым поисковым переменным ѵц, т. е. к элементам матрицы V. 
После несложных выкладок придем к следующей задаче: 


шіп 2 2 ѵ )і 

ѵ і) і=і /= 1 

Ѵс) = Г} 


(11.64) 

(11.65) 


где 


Г; = Ггу С} = ЧГЧ} (11,66) 

Заметим, что задача (11,64) выглядит так же, как задача (11,42), (11,43), поэтому по 
аналогии с выражением (11,46) получим 


V = 


с і с і 


(вг- , 5 / ) т (г- 1 з ) 


(П,67) 


Умножив полученное на К 7-1 слева и на П7' 1 справа, введя матрицу М 
вектор ѵ = ДІз и используя формулу (11,38), получим 


В,- 

1 


ІУі — В)3]) ѵ Т 

Т 

У 


(I Г- 1 ) 7 ^- 1 , 


( 11 , 68 ) 
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^/+і ~ н і + 


(П,69) 


Используя формулу (11,48), получим выражение для Матрицы М иі 

(V — Н]у}) ѵ т Н і 
іУі 

р„ а і? еТИМ ’ что ’ пос „кольку матрица М является произвольной и невыпожленной « 
есть произвольный вектор. Поэтому в формулах (11,68) и (II 69) его можно выби 
рать, что позволит улучшить сходимость метода. Прежде всего вектоп н 

раже.шиаі бэГчтТбѵ 0 ™ ° т Р ебованием максимальности знаменателя др Р 0 би в вы- 
ражении (11,69), что будет препятствовать его обоашению в нѵіп, к а™,, 

вектор ѵ находится решением следующей экстремальной задачи: ' УЧЗе 

тах іуі (11,70) 

° Ту=1 (И, 71) 

ранжа. Функвд Л я Я Ла“ Р Тнжа Э имее? а вид: В0СП0льзуемся мето Д° м множителей Лаг- 

Ь =п т Яда + 0,5Я(о т ц— 1) 

Приравняв производную 7. по у нулю, получим 

ѵ = Н іуі !% 

Подставив это значение ѵ в выражение (11,69), найдем 

(.у - Ніуі) (НтѴНі 


(П,72) 


(П,73) 


Н ■ 


Ч+\~ н ,+ (НтГНіуі 


(іеі В ]+1 


-- сіеі В. сіеі 


+• 


Т 

5 


Воспользуемся следующей формулой [31 ]: 

сіеі (/„ + аЬ т ) = 1 +Ь т а 

где а, Ь — /г-векторы. Применяя эту формулу, найдем 


бе! 

Введем обозначения А - 
экстремальной задаче: 


Іп Л- 


( в /Ч- д /)° т 


>? 


ѵ т В~ 


т 

з'-ѵ 


(11,74) 


(П,75) 


(11,76) 


= В у . у,- Ь «4 «у, тогда задача выбора ѵ сведется к следующей 


шах (тіп) 


ѵ г А 

ѵ т Ь 


ѵ т ѵ 


1 


(П, 77) 


Операцию максимизации необходимо проводить, если величина лпоби ок^рт™ 
положительной и минимизацию — если отрицательной <ЬяктніІр,/ И окажется 

?цоби М в У (П С 77^ П Г СЛСДУЮЩИМ об Р азом - Потребуем временно, чтобы знаменатель 
будет иміть від Л Р*™ НеК ° Т ° Р ° Й П0СТ0ЯНН0Й Р- В этом случае задача (II, 77) 

ѵ т А 

Т ~ (П> 78 ) 


ѵ г Ь = р 


ѵ т ѵ = 1 


(П,79) 
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Функция Лагранжа этой задачи записывается так: 

Ь = Ѵ Т СІ/р + \іѴ Г Ь + ^2Ѵ Т Ѵ 

Приравняв производную дЬ/дѵ нулю, подставляя полученное выражение для ѵ 
в первую формулу (11,79) и исключая Х 2 , получим квадратное уравнение для опре- 
деления 

(йІр + 1 1 Ьу(<ІІр+'к 1 Ь) = {\Ір*)(йѢІр-\-'к 1 ЪѢ)* (11,80) 

Итак, процедура решения задачи (11,77) будет выглядеть следующим образом. 
Для фиксированного значения р из выражения (11,80) находятся два корня и соот- 
ветствующие им два значения критерия ѵ т <і/р. Из этих двух значений критерия вы- 
бирается наибольшее по абсолютной величине, которое и будет решением задачи 
(11,78), (11,79). Обозначим его через ( ѵ т <і/р )*. Поскольку величина ( ѵ т сІІр )* является 
некоторой функцией параметра р, то для решения задачи (11,77) необходимо орга- 
низовать поиск максимума величины (ѵ т сІ/р)* как функции одной переменной р. 
Для определения вектора й надо решить систему линейных уравнений 

Віі = У} (11,81) 

Система уравнений ( 11 , 22 ) отличается от полученной только правой частью, но в лю- 
бом случае она должна решаться. Поэтому решение системы (11,81) будет суще- 
ственно более простой задачей. 


Квазиньютоновсние методы с постоянной 
глубиной памяти 


Поскольку глубина памяти <7 в данном случае постоянна (<7 > 1), этот метод может 
начать работать после того, как каким-либо другим способом (скажем, квазинью- 
тоновскими методами 1-го ряда) накоплены векторы уд, зъ (к = 0, <7 — 1). Для 
определенности будем аппроксимировать саму матрицу Якоби. Матрицу В / +1 
найдем в виде (11,38). В данном случае должны выполняться 17 соотношений (11,39). 
Для определения матрицы Е применим принцип наименьшего изменения матрицы 
задача определения матрицы Е примет вид [26]: 

П П 

шіп 2 ] 2 4 / (П,82) 

е и *= і /= і 

Ез і = г і і = ], /— 1,..., / — < 7 + 1 (11,83) 

Функция Лагранжа имеет вид: 




А=1 / = 1 р= 1 к = 1 


-Р+1 


дь 4 Р) — к- тая компонента вектора множителей Лагранжа Х < ~ р '> , соответствующего 
р-м/ условию (11,83). Приравнивая производные Ь по ец нулю, по аналогии с (11,45) 
легко получить 

е=- (аЯв, + я< 2 \_і + • • • + * ( Ѵж) ("’ 84 ) 

Подставляя это значение Е в ц условий (11,83), получим уравнения для определения 
множителей Лагранжа: 


* 0> ф/ + >- <2) 4-л + • • • + ^4-,+л- = 


(П,85) 


^ 8 / 8 /— <7+1 + ^ 8 /— I 8 /— 7+1 + ' • • + ^ 8 / — 7+І 5 / — ^+1 “ — (7+1 

Уравнения (11,85) являются системой из л <7 уравнений относительно п <7 неизвестных 
компонент векторов ..., Х^К Однако специальная структура этой системы поз- 
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воляет свести ее решение к существенно более простой задаче. Действительно, бу- 
дем временно считать величины г- ь (і = 1, < 7 ) скалярами. Тогда система (11,85) 
превратится в систему из <7 уравнений с д неизвестными. Обозначим через Д опре- 
делитель системы (11,85). Тогда ее решение примет вид 

^(О = ^ — а-4-і 

к = 1 

где Рйі = Мы/ А; Мы — алгебраическое дополнение элемента определителя Д, 
стоящего на пересечении к - той строки и і-го столбца. Теперь снова будем считать 
и гі векторами. Простой подстановкой этих выражений для X ^ в систему (11,85) 
легко убедиться в том, что эти формулы будут верны и в случае,, когда X ^ и г* — 
векторы. 


Квазиньютоновскае методы 2-го рода 

Линейные системы. Рассмотрим вначале случай, когда система (И, 8 ) 
является линейной [см. выражение (11,20)]. Приближения Я; 
к обратной матрице Якоби, т. е. в данном случае к матрице Л -1 , 
будем находиться так, чтобы она удовлетворяла матричному урав- 
нению (П,32) [25, 26 ]. Покажем, что на п-м шаге будет выполняться 
равенство 

Н п тА-і ( 11 , 86 ) 

если п построенных направлений р 0 , ..., р п _ х будут линейно неза- 
висимыми. Действительно, пусть векторы р, строятся с помощью 
формулы (11,23), в которой матрицы Я ; удовлетворяют соотноше- 
нию (11,32). На п-м шаге будет выполняться соотношение 

НпѴпЩЗп (11,87) 

При і = п матрицы У і, 5,- становятся квадратными. Ясно, что век- 
торы 57 (/ = 0 , п — 1 ) также являются линейно независимыми (они 
коллинеарны векторам р (/ = 0, п — 1), отсюда сіе! З п Ф 0). Из 
уравнения (II, 87) имеем сіеі 5 П = беі Н п беі У п . Следовательно, 
сіе! У п Ф 0, йеі Н п Ф 0 и существует обратная матрица Уй\ а век- 
торы у 0 , ..., у п _ х линейно независимы. Умножая равенство (И, 87) 
на У~ п { и подставляя в полученное выражение значение 5„ из (11,37), 
легко получить равенство (II, 86 ). Имеет место также следующий 
результат [32]: если |д/}о І-1) — семейство векторов ро, ■■■, Рі~і и 
Я; — неособенная матрица, удовлетворяющая условию (11,32), 
то для линейной системы ( 11 , 20 ) вектор р г , построенный с помощью 
формулы (11,32), либо является линейно независимым относительно 
{Р 7 Іо‘ _1) . либо точка хі + і является решением системы ( 11 , 20 ). 

Рассмотрим теперь вопрос об определении матрицы Я г . Введем 
две вспомогательные матрицы Кі (/ = 1, 2 ) следующим образом 

К{ = 1п-У[У{ (И. 88) 

где Ус (і — 1 , 2 ) ^-обратные матрицы [ 11 , с. 266], удовлетворяющие 
соотношениям 

УіУ{Уі = Уі 


(П,89) 

41 


т эд? Ь м ? аВШ о С Д общего решения системы уравнений 
пі ^ дс 7 а п 7 И подходом - развитым в работе [33] (см. также 
Іи, с. 66—70]), можно получить следующие рекуррентные фор- 
мулы для определения матрицы Н г : 




"ж 


н і + 


-Я 




{ н і~Щ)уАіК\ 

°иК\Уі 


ѴсУс сІ і К]у і 


**+і=*Г 


( к і — ! п) уАМ уАцК[ 


где Ні 


‘ + 1 '* Т ѴІ 

с ЦЦуі 

произвольная ( п X л)-матрица. 

К‘о = 'п 

Я 0 = Я 




(11,90) 


(П,91) 


(11,92) 

(П.93) 


Матрицы Кі обладают следующими свойствами. 

Если направления 5 0 , ..., 5,*^ линейно независимы, то выпол- 
няются равенства 

1. К' п = 0 /= 1, 2 (11,94) 

2. К]Ц = К[ /-=1,2 (И, 95) 

3 - ^•( / а~' А: 0= о /'=1,2 (11,96) 

Равенства (11,95), (11,96) просто доказываются подстановкой в них 
в величины К\ из уравнения (II, 88) и применением равенства (11,89). 

Остановимся подробнее на первом свойстве. Как было показано 
выше, из линейной независимости векторов 5 0 , ..., 5 П _ Х следует суще- 
ствование обратной матрицы Ѵ„ 1 . Тогда, из соотношения (11,89) 

при і = п получим ѴпУ’п = І п • Откуда, учитывая формулу (II 88) 
получим равенство (II, 94). " 

Построение частных формул определения матрицы Н,. Соотно- 
шения (11,90), (11,91) являются достаточно общими формулами 

построения матрицы Н и зависящими от произвольной матрицы К 
и произвольных векторов с я , (/ = 1, 2). Давая произвольным 
величинам определенные значения, можно получить частные фор- 
мулы для определения Н и Совокупность этих формул обычно назы- 
вают семейством формул Адачи [33]. Если положить с,, = ф- 
и с 2і = й 2і в формулах (11,90), то 


н і + і 


= И, + 


(«Г Н іУі + ККЪі) СиК\ 


*/+. = *Г 


°иК\Уі 

‘}МУі 


с 1,к% 


Ж 1, 2 


(Н,97) 


(11,98) 
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Если 


(Іц — СІ 2 ( — (1[ 


Сц •=— С 21 — С і 

ТО 

*' = *? = *, 


„ , 0 (Я, - К) Уі с] Кі 

1+1 1 *]КіУі с]К іУі 

(11,99) 

„ У ЛК, 

К ‘ + 1 Іі/ 

с і к іУ с^іУі 

(11,100) 

Если в выражении (II, 100) с* = Д, то 


Н і+1 -н.+ 

+ ‘ с}К іУі 

(И. 101) 

г „ КіѴ&Кі 

К,+ '~ К ‘ 

(II, 102) 


Заметим, что поскольку существует равенство (II, 86), то любая 
формула из семейства (II, 90), (II, 91) может быть использована 
для определения обратной матрицы, а также для решения систем 
линейных уравнений. Эти формулы особенно полезны в том случае, 
когда явный вид матрицы А и вектора Ь в системе линейных урав- 
нений (II, 20) нам неизвестен, и мы можем найти / (х) = Ах + Ь 
только при заданном х. Такая ситуация может иметь место, когда 
модели блоков ХТС линейны и используется последовательный 
метод расчета ХТС. Действительно, в этом случае система уравнений 
относительно итерируемых переменных (II, 5) будет иметь вид (II, 20), 
в котором явный вид (л Хл)-матрицы А и вектора Ь нам неизвестен] 
и мы можем найти / (х).= Ах + Ь только по заданному х, зная 
модели блоков и последовательность их расчета. Используя любую 
из формул семейства (II, 90), (II, 91) совместное уравнениями (II, 14), 
(II, 23), мы на л-м шаге получим матрицу Л -1 и решение системы 
(И, 20) (см. с. 41). 

Так же, как были выведены формулы (II, 90)— (II, 102) для ап- 
проксимации матрицы обратной матрице Якоби, могут быть выведены 
формулы для аппроксимации В г самой матрицы Якоби. Для этого 
к системе (II, 29) надо применить общую формулу решения матрич- 
ных уравнений [11, с. 267]. Рассуждая так же, как и в предыдущем 
случае, легко получить аналоги формул (II, 90)— (II, 102) для 
матрицы Ві. Легко видеть, что формально эти выражения могут 
быть получены из формул (II, 90) — (II, 102), если поменять местами 
величины 5 ; и уі. Выпишем здесь только аналоги формул (II, 101). 
(II, 102): * ’ 


в о , (Уі ~ В і°і) <?іКі 

,+{ ‘ + 

(II, 103) 

К:5,С]К,- 

1 г гг 1 1 1 1 

К І+ 1 К і т ту- 

с і^і в і 

(II, 104) 
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Так же, как было доказано равенство (ІІ, 86), можно показать, что 
при і = п будет выполняться равенство 

В п = А (И, 105) 

Остановимся подробнее на применении формул (II, 101), (II, 102) 
или (II, 103), (II, 104). В них имеется произвольный вектор с г . 
Единственное условие, которому должен удовлетворять этот вектор, 
состоит в том, чтобы знаменатель в выражениях (II, 101), (II, 102) 
был отличен от нуля. В работе [33 ] в качестве с* рекомендуется 
поочередно выбирать столбцы единичной матрицы І п . Однако более 
правильно выбирать с і} чтобы улучшить сходимость и предотвратить 
появление нежелательных явлений. Для выбора с* здесь могут быть 
привлечены те же самые соображения, что и при выборе вектора ѵ 
в формуле (II, 70). Можно выбирать с* так, чтобы знаменатель в вы- 
ражениях (II, 101), (II, 102) был максимальным, что будет препят- 
ствовать его стремлению к нулю. В этом случае определение век- 
тора Сі будет подобно решению задачи (II, 71), (II, 72). По ана- 
логии с формулой (II, 73) ее решение будет иметь вид с* = — КіУі/к 
(к — множитель Лагранжа). Подставляя это значение в выраже- 
ния (II, 101), (II, 102), найдем: 


= Н і + 


У№іѴі 


*И-і = **~ 


КіУіУЖЪ 

у]К]К г у с 


(II, 106) 


Непосредственной проверкой легко убедиться, что если КІ = К і, 
то и /С]+і = Кі+і, т. е. если Ко = Ко, то и все последующие матрицы Кі 
будут симметричными. Используя симметричность Кі и равенство 
(II, 95), преобразуем соотношения (II, 106) 


Я,-,! — н. + 


К 1+1 =-■ к і 


{*і-Н 1 У і )У Т іКі 
У\ К іУі 
к іУіУіКі 


„ Уі^іУі 

Введем обозначение 

а-і = КіУі 

и перепишем формулу (И, 107) в виде 


(И, 107) 
(II, 108) 
(II, 109) 


Н (+х — н. + 


а \Уі 


(II, 110) 


В главе III будет показано, что матрица Кі, имеющая структуру 
(II, 108) [см. выражение (III, 54)], является оператором проекти- 
рования на подпространство С, ортогональное подпространству, 
натянутому на векторы у 0 , ..., у г _ х , а вектор а г является ортогональ- 
ной проекцией у ь на подпространство С, т. е. 


і — 0 (II, 111) 

Верно и обратное, т. е. если при всех і вектор а* удовлетворяет 
условию (II, 111), то матрица Я г будет удовлетворять уравне- 
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йию (И, 32). Действительно, пусть на /-том шаге выполняется соот- 
ношение (II, 32) и вектор аі удовлетворяет условию (II, 111), тогда 
и Н і+1 из соотношения (II, 110) будет удовлетворять уравнению 

Ні+тУ г+і = 5 г+1 ИЛИ 

Н і+І у і =в і 1 0 (11,112) 

Действительно, умножив (II, ПО) на у и получим: 

Ні+іУі = НіУі + ( 5 ; — НіУі) = Зі 

Следовательно, соотношение (II, 112) для / = і доказано. Умножим 
теперь уравнение (II, ПО) на у к (к < і — 1), и в соответствии с вы- 
ражениями (II, 111), (11,32) получим Н ш у к = Н;у к = з к (к < і — 1), 
что подтверждает справедливость соотношения (II, 1і2) при / < і. 
Проведя аналогичные рассуждения для случая, когда ищется приб- 
лижение к самой матрице Якоби, получим формулу, аналогичную 
соотношению (II, ПО) для определения матриц В ь 


(у. — В. в.) ь т , 
в. + і = в. + ІД 


Ь)з, 


(II, 113) 


где Ъ должно удовлетворять условию Ь'Зі = 0. 

В случае, когда вектор Ьі будет выбираться из условия макси- 
мальности знаменателя в правой части формулы (II, 113), он (век- 
тор) должен определяться по формуле 


Ь. =Р. 5 . 

I II 


Р і + 1 


Р М Р , 

*1 р і*і 


(II, 114) 


Если строится аппроксимация к самой матрице Якоби [см. фор- 
мулы (II, 103), (II, 104)] очень важно, чтобы матрицы В х не стано- 
вились вырожденными. В этом случае может оказаться целесооб- 
разным выбирать Сі из условия максимальности <іе1 В/ +1 по абсо- 
лютной величине, а способ определения с х будет очень похож на 
способ определения вектора ѵ, обеспечивающий максимум абсолют- 
ной величины детерминанта матрицы В ]+1 в выражении (II, 69). 
Поэтому на данном вопросе мы остановимся очень кратко. Вынеся 
матрицу В г в правой части равенства (И, 113) за скобку, и восполь- 
зовавшись правилом вычисления определителя произведения мат- 
риц и формулой (II, 75), придем к задаче (II, 77), в которой 




Уі 


Ь = К.у. 


Отметим еще один очень возможный способ выбора параметров с,. 
Как уже указывалось (см. с. 37) полезным оказался принцип наи- 
меньшего изменения аппроксимирующей матрицы, на основе кото-' 
рого были получены выражения для матриц Я и В в квазиньюто- 
новских методах 1-го рода. В данном случае вид матриц Е и О из- 
вестен. Его легко получить из формул (И, 101), (II, 103). Произ- 
вольные константы с в этих формулах можно попытаться определить, 
исходя из этого принципа. 
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Нелинейные системы. Решение нелинейной системы (II, 8), 
в отличие от линейной, не будет получено за п шагов. Поэтому ите- 
рационный процесс, определяемый формулами (II, 14), (II, 23), 
(II, 90) и (II, 91) должен быть продолжен при і > п. Однако в соот- 
ветствии с равенством (II, 94) матрица К'п становится нулевой при 
і = п и формула (II, 91) теряет смысл. Здесь можно поступить 
следующим образом. Мы можем считать, что в результате п шагов 
закончен некоторый цикл и мы получили некоторое приближе- 
ние Н п к матрице ^п 1 ; далее в качестве начального значения Я 0 
используется полученное значение Н п , а матрицы КІ берутся рав- 
ными единичным. В конце этого цикла опять проделывается та же 
процедура, и т. д. Чтобы выразить математически эту процедуру, 
для матриц Ні, КІ удобно ввести второй индекс I (номер цикла) и 
записывать их в виде Я,- , і , КІ, і ■ Тогда внутри каждого цикла индекс і 
(номер шага) будет меняться от 1 до п, а индекс I будет изменяться 
на единицу через каждые п шагов. Тогда итерационный процесс, 
определяемый формулами (II, 14), (II, 23), (II, 90), (II, 91) можно 
представить состоящим из циклов. Внутри цикла матрицы Я ;>ь 
Кі.і преобразуются в соответствии с формулами (11,90), (11,91), 
а в начальной точке каждого цикла матрицы Ні , и КІ, і определяются 
следующим образом: 

н п.і-і = Н 0 ,і К 1 0ш1 = 1 п (ІІ,П5) 

Рассмотрим применение этого циклического итерационного про- 
цесса в случае линейных уравнений (II, 20). Как было показано, 
применение любой из формул семейства (II, 90), (II, 91) приведет 
к тому, что при і = п будет выполняться равенство (II, 86). В соот- 
ветствии с циклическим способом применения формул (II, 90), 
(II, 91) при і = кп (к — 1, 2, ...) будут выполняться равенства 
Нп, п = А -1 . Рассмотрим теперь использование формул (II, 103), 
(II, 104). Применяя формулу (II, 103) при і — п и используя выра- 
жение (II, 35) и равенство В п = А, легко найти, что В п+1 = А. 
Аналогичным образом можно показать, что при всех і > п будет 
выполняться равенство 

В г = А і>п (11,116) 

Расчет стационарных режимов 
химико-технологического процесса 
Вильямса- Отто 

В этом и следующих разделах приведены результаты численных 
расчетов на ЭВМ стационарных режимов ряда химико-технологи- 
ческих процессов. При проведении расчетов использовались, в ос- 
новном, квазиньютоновские методы решения систем нелинейных 
уравнений: фАМ , определяемый преобразованием (И, 101) и Вгоу- 
йеп [см. преобразование (11,49)]. В соответствующих алгоритмах 
каждая следующая итерационная точка в пространстве независимых 
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Рис. 7. Схема процесса Виль- 
ямса — Отто: 

1 — реактор идеального пере- 
мешивания; 2 — теплообмен- 
ник; 3 — фильтр; 4 — ректи- 
фикационная колонна. 


переменных определи- 
лась условием, чтобы 
вычисленное в этой точ- 
ке значение нормы 
вектора левых частей 
системы уравнений было 
меньше, чем в предыдущей. В качестве начального приближения Н 0 
к обратной матрице Якоби выбиралась либо разностная аппрокси- 
мация матрицы Якоби в начальной точке с последующим обраще- 
нием (соответствующие варианты методов обозначаются далее С}ЫМ1, 
ВгоуЗеп 1), либо единичная матрица /„ (соответствующие варианты 
обозначены через С}ЫМ2, Вгоуйеп2). Некоторые из приводимых ре- 
зультатов получены методом простой итерации (в случае сходи- 
мости). Применялись также и другие методы решения систем 
нелинейных уравнений: БЕМ [37], ОБЕМ [23], метод Вольфа 
13, с. 35]. 

Рассмотрим, ставший уже традиционным, модельный химико- 
технологический процесс Вильямса — Отто [38; 39]; получаемый 
продукт обозначаем через Р (рис. 7). Схема состоит из реактора иде- 
ального перемешивания 1, теплообменника 2, фильтра 3 и ректифи- 
кационной колонны 4. В реакторе протекают следующие необра- 
тимые реакции второго порядка: 

А + В—-* С С + В—^ Р + Е Р + С—+0 (II, 117) 

где к г — константы скоростей реакций. Реагенты А, В — сырьевые 
продукты. Поток из реактора 1 подается в теплообменник 2, где 
охлаждается до температуры, достаточной для полного отделения 
побочного продукта С в фильтре 3. Поток с остальными компонен- 
тами подается на вход ректификационной колонны 4, из верхней 
части которой отбирается продукт Р. Известно, что компоненты Р 
и Е образуют азеотропную смесь, в которой относительная доля Р 
составляет 10 % (масс.). Это определяет режим работы колонны и 
учитывается при ее моделировании. Поток, выходящий из нижней 
части колонны 4, разделяется на две части: одна выводится из схемы 
и утилизируется, вторая возвращается в цикл, на вход реак- 
тора 1. 

Задачу расчета режима данной замкнутой ХТС при заданных 
расходах сырья Р А , Р в , объеме реактора (У = 60 условных еди- 
ниц), температуре в реакторе Т и коэффициенте рецикла а рассмот- 
рим, как задачу решения системы нелинейных уравнений относи- 
тельно величин Р ЙЛ , Р ЙВ , Р КС , Р йе , Р йй , выражающих концен- 
трации компонент А, В, С, Е, Р в выходном потоке реактора, Соот- 
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ветствующая система уравнений формируется на основе математи- 
ческих моделей элементов схемы: 
для реактора 


Ррл — Ра + Я а 


кіРрлРрвѴр 

р2 р 


(И, 118) 


Р кв = р в (— к г Рр А Рр в — к 2 Рр в рр С ) Ѵ р 

р 2 
Р Р 

Ррс = Яс + ^ 2кіРг!Ар ^ п — 2кгРрвРрс — к 3 РрдРрр) Ѵр 

Р 2 

Гр 


(II, 119) 
(И, 120) 


(М, Ш, 
Гр 

Р* 0 =Р 0 + ^ЬРр вРрс - о ,Ък я Р яс Р КР ) Ѵр (ІІІ 12 

где 

= Ра + Рв + Я а + Я в + Яс + Яе + Яр (II, 123) 

р — плотность (р = 50 условных единиц); к г — константы скоро- 
стей реакции, рассчитываемые по формулам к[ шА* ехр ( — ВІ/ТѴ 
I — температура в реакторе (значения коэффициентов А1 и В? 
даны в табл. 2). 

для ректификационной колонны 


Рзі^Ррі Г**А,В,С,Е Р 3 р~0,1Р КЕ (11,124) 


для делителя потока (расположен после колонны) 


Яі — а,Р & і і = А, В, С, Е, Р (11,125) 

В связи с тем, что при решении этой системы метод простой ите- 
рации дает расходящуюся последовательность приближений, рас- 
сматривалась также и видоизмененная система уравнений лля 
реактора 


РРА 


Ра 4- На 


ррв =* 


Рв + Я в 

1 + (к % Р Г<А 4 - к 2 Р КС ) ѴрР К 2 


Яд + 2к х Рд А Р ЯВ УрР К ~ 

1 + ( 2к і Ррв + к з р рр) ѵ ?Рр 2 


РЕ 


РРР 


Яр \ к % Р р В Р 'цдѴрР 
1 І0,5^ С У Р Р- 2 


Я Е + %к 2 Р р В Р ^ С Ѵ рр 

(II, 126) 


В этом случае метод простой итерации обеспечивал сходимость. При 
всех методах расчет начинался из 6 начальных точек. Значения, 
принимаемые параметрами Р А , Р в , а, Т и итерируемыми перемен- 
ными Р Н1 (I — А, В, С, Е, Р) в этих точках, приведены в табл. 3. 
Данные по расчету схемы приведены: в случае использования 
модели (II, 118) (II, 123) — в таблице 4, а в случае использова- 
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Таблица 2. Параметры 
констант скоростей 


і 

* 

А . 

і 

в! 

і 

1 

5,9755- 10» 

12-Ю 3 

2 

2,5962- ІО 12 

15- 10 3 

3 

9,6283- ІО 15 

20- ІО 3 


ния модели (11,126) — в таблице 5. 

В первой строке таблицы 4 (а также 
таблицы 5) даны значения нормы век- 
тора невязок системы уравнений мо- 
дели в начальной точке — ЫОЯМ 0 , 
в остальных — число обращений к рас- 
чету модели. 

Чтобы получить начальное при- 
ближение Я„ для обратной матрицы 

Якоби [системы (11,118) — (11,123) или (11,126), производные 
левых частей систем нелинейных уравнений аппроксимировались 
с помощью конечных разностей (с последующим обращением полу- 
ченной матрицы). В соответствии с рекомендациями [24] прираще- 
ния независимых переменных Дх* выбирались равными: Дх* = 
= 0,001х 0 , і (здесь х и , г — і-тая координата начальной точки х 0 ). 
При этом затраты на вычисление разностной аппроксимации мат- 
рицы Якоби в начальной точке эквивалентны ( п + 1)-му расчету 
левых частей системы уравнений. 

При использовании хорошего начального приближения для х 0 
(см. табл. 3, столбец для начальной точки 3) методы С[ШМ1 и (ЗИМ2 
давали такие же (либо лучшие) результаты, что и соответствующие 


Таблица 3. Значения переменных в начальных точках 


Значения переменных для начальных точек 1 —6 


Переменная 

1 

2 

3 

4 

5 

6 

Ра 

■■я 

11 540 

13 546 

13 546 

И 540 

10 000 

Рв 

ІИМй м 

31 230 

31 523 

31 523 

31 230 

40 000 

а 


0,58 

0,75 

0,896 

0,896 

0,896 

Рва 

ІіШІ 

8 820 

18 187 

38 420 

38 493 

38 251 

Рвв 


39 910 

60 815 

121 745 

121 833 

120 818 

Рве 


2 360 

3 331 

7 296 

7311 

7 266 

Рве 

15 000 

31 660 

60 542 

137 541 

137 708 

136 416 

Рвр 


7 890 

10 817 

18 517 

18 534 

18 405 

т 


610 

656 

654 

654 

654 


Таблица 4. Результаты расчета схемы Вильямса — Отто по уравнениям 
(II, 118) — (II, 125) * 


Метод 

Результаты для начальных точек 1—6 

1 

2 

3 

4 

5 

6 

ыоям 0 

29 286 

16 103 

428 

11 302 

17 735 

85 502 

сіммі 

14 

14 

10 

26 

15 

23 

Вгоціеп 1 

15 

14 

10 

25 

20 

25 

С}М'М2 

21 

21 

23 

28 

27 

34 

Вгоуйеп 2 

55 

41 

49 

89 

94 

136 
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Таблица 5. Результаты расчета схемы Вильямса— Отто 
( 11 , 124 )— ( 11 , 126 ) 


по уравнениям 


Результаты для начальных точек 1 —6 


Метод 

1 

2 

3 

4 

5 

6 

моим о 

23 159 

15 085 

331 

9 661 

14 234 

59 010 

С}ММ1 

16 

14 

п 

112 

80 

29 

Вгоуйеп 1 

17 

14 

п 

92 

155 

31 

РУѴМ2 

23 

21 

19 

25 

22 

37 

Вгоуйеп 2 

88 

52 

53 

170 

144 

117 

Простая итерация 

105 

66 

114 

281 

285 

283 


варианты метода Бройдена (см. табл. 4 и табл. 5, столбцы для на- 
чальных точек 3). При использовании плохого начального прибли- 
жения для (см. табл. 3, столбцы для начальных точек 1 — 2, 4 6) 

метод ($Ш во многих случаях давал существенно лучшие резуль- 
таты, чем метод Бройдена. Расчет схемы (см. рис. 7) с помощью 
метода РИМ2 показал, что число вычислений незначительно уве- 
личивается при переходе от хорошего приближения к плохому. 

Интересно отметить, что методы Бройдена и (^М сходились, 
когда метод простой итерации расходился, и давали существенно 
лучшие результаты, когда метод простой итерации сходился. При- 
чем применение метода Бройдена и РИМ для расчета варианта 
математической модели схемы, приведенной на рис. 7, для которого 
процесс простой итерации расходился, давало лучшие результаты, 
чем применение этих же методов для расчета варианта математи- 
ческой модели, для которого простая итерация обеспечивала схо- 
димость. 


Расчет стационарных режимов 
химико-технологической системы 
изомеризации н-пентана* 

Краткое описание технологического процесса. ХТС изомеризации 
«-пентана предназначена для получения изопентана высокотемпе- 
ратурным способом [40, с. 85]. Целевой продукт (изопентан) яв- 
ляется остродефицитным, вследствие его широкого использования 
в качестве растворителя (производства изопренового каучука и 
бутилкаучука) в качестве компонента высокооктановых бензинов 
и для других целей. Технологический процесс производства изо- 
пентана представляет собой замкнутую химико-технологическую 
схему с материальными и тепловыми рециклами, что обусловлено 
современными требованиями рекуперации тепла и использования 
непрореагировавшего сырья; схема состоит из следующих основных 
узлов: азеотропная осушка исходной н-пентановой фракции, изо- 
меризация н-пентана, водородсодержащего газа (ВСГ), комприми- 
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Раздел написан совместно с В. Б. Покровским и Н. Н. Зиятдиновым. 



Рис. 8. Схема ХТС изомеризации н-пентана: 

1, 9, 11, 22 — рекуперативные теплообменники; 2, 6, 7, 17, 20 — смесители потоков; 3, 
4, 10 — ректификационные колонны; 5 — колонна азеотропной осушки; 8, 19 — делители 
потоков; 12 — пароперегревательная печь; 13 — реактор; 14 — адсорбер; 15, 21, 24 — 
сепараторы; 16, 23, 25 — теплообменники; 18 — компрессор; І — ІѴ — номера разрываемых 
потоков. 

н-С ь — сырье («-пентановая фракция); и-С ь — продукт (изопентановая фракция); С в — 
гексановая фракция; Л У — легкие углеводороды; Н 2 — свежий водород; ВСГ — водород- 
содержащий газ. 


рование и осушка ВСГ, ректификация продуктов реакции (рис. 8). 
Сырье, я-пентановая фракция, после колонны азеотропной осушки 5 
смешивается с я-пентановой фракцией рецикла и циркулирующим 
ВСГ, нагревается в рекуператоре 11 и печи 12 и поступает на изо- 
меризацию в реактор 13. Процесс изомеризации протекает при тем- 
пературе 360 — 450 °С и давлении 35- 10 е Па в реакторе с неподвиж- 
ным слоем алюмоплатинового катализатора в среде ВСГ. Побочной 
реакцией является крекинг я-пентана и изопентана в легкие угле- 
водороды. Контактный газ из реактора охлаждается и конденси- 
руется в рекуператорах И, 22, холодильниках 23, 25, отделяется 
от ВСГ в сепараторах 24, 21 и через рекуператоры 22, 9 поступает 
в ректификационную колонну 10, где происходит выделение легких 
углеводородов (Л У). Кубовый продукт колонны 10, изопентан-пен- 
тановая фракция, через рекуператоры 9, 1 поступает в ректифи- 
кационную колонну 3 на выделение целевого продукта (изопентан). 
Кубовый продукт колонны 3 (непрореагировавший в реакторе я-пен- 
тан) поступает в ректификационную колонну 4 на выделение фрак- 
ции гексан и выше, и далее в качестве рецикла смешивается со све- 
жим я-пентаном. Циркулирующий ВСГ поступает на всасывание 
компрессора 18. На выходе компрессора сжатый ВСГ смешивается 
со свежим водородом и, пройдя холодильник 16, сепаратор 15 и 
адсорбер 14, поступает на смешение с я-пентановой фракцией. 

Математические модели аппаратов приведены ниже. 

Реактор 13. Реакция высокотемпературной изомеризации я-пен- 
тана на бифункциональном катализаторе протекает через стадии 
дегидрирования я-пентана в олефин, изомеризации олефина в изо- 
олефин, гидрирования изоолефина в изопентан. Учитывая, что лими- 
тирующей стадией реакции является изомеризация олефина [41 ] 
и что, кроме основной реакции, процесс сопровождается необра- 
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ТимЬім гидрокрекингом «-пентана и изопентана в легкие углеводо- 
роды (метан-бутановая фракция), упрощенный механизм реакции 
может быть представлен в виде 


Хі<-^—Х2 Хі -*■ ссіХ 3 Х 2 — і ~> а 2 Х 3 (II, 127) 

где Х х — я-пентан^ А 2 — изопентан; А 3 — легкие углеводороды; 
Ші скорость і-той реакции; а ь а 2 — стехиометрические коэф- 
фициенты. Реакции крекинга играют незначительную роль вслед- 
ствие того, что реакция изомеризации протекает с малым тепловым 
эффектом и высокой селективностью. Этим обусловливается низкий 
суммарный тепловой эффект процесса, составляющий 84 кДж/кг 
сырья. Влияние параметров процесса на изомеризацию я-пентана 
описано в [42]. Скорости реакции изомеризации и побочных реак- 
ций описываются уравнениями 

ш і ~ к іР\! Рн 2 ш і = к 2 Р г І Рн 2 =» Р. І Р 1 ^4 = 6 4 р 2 (II, 128) 

где р х , р 2 , р н , парциальные давления я-пентана, изопентана и 
водорода соответственно; к { (і = 1,4) — кажущиеся константы ско- 
ростей реакций, зависимость которых от температуры выражается 
уравнением Аррениуса: к г = к оі ехр (—Е^КТ), в котором /? — 
газовая постоянная; Т — абсолютная температура; величины 
к оі [кмоль/(ч-м 3 -ЛШа) ], ^ [кДж/(моль-К) ] и Д [кДж/моль] равны 
^02 = 0,92. ЮН к 03 = 0, 12. 10 18 к 0і » 0,45- 10 1в 
^2= 139,0 Е 3 = 330,8 2^4 = 221,9 Я = 8,3- ІО” 3 

^Константа равновесия реакции изомеризации к = к х /к, в рабо- 
чей области температур аппроксимируется уравнением [40 с 72 1 - 
к = 2,89 + 0,0044 (600 — Т). ’ ‘ 

В математическом описании реактора изомеризации я-пентана 
приняты следующие допущения: гидродинамическая обстановка 
в промышленном аппарате близка к потоку идеального вытеснения; 
тепловой режим является адиабатическим; активность катализатора 
стабильна в течение длительного времени, тепловым балансом можно 
пренебречь. В окончательном виде математическое описание, полу- 
ченное интегрированием исходной системы дифференциальных урав- 
нений, выглядит так: 


Х 1 Ж [ Гі + А (к 2 + кіР)] ехр (п Ф ) + с 2 [г 2 + А (к 2 + к х р) ] ехр (г 2ф ) 
х 2 = Акк 2 [сх ехр (/- 1ф ) А- с 2 ехр (г 2ф )] і = і» + 

х 3 _ Ар {«іА 3 І г і + А (к 2 4- Кр)] 4- к 2 к х Акк 2 ] [е хр (гі Ф ) — 1] сі 

П 

Ар (оц&з [г 2 + А (к 2 + А 4 р)] -)- « 2 к 4 Ак 2 к) [ехр (г 2ф ) — 1 ]с 2 0 


(II, 129) 
(II, 130) 


(II, 131) 


° = Ѵ[кі (к — 1) + (к л — к х ) р]2 + 4 кк\ 
гі, 2 — А [к г (А + 1) + (Аз + А 4 ) р] ± Ай }/ 2 А = р К Ѵ К ПТ/вр 

г. Акк 2 х\ х% \ г і А [к 2 &,р)] х? 

1 Жкгб с ^~ с ' + ~т; 


(11,132) 
(И, 133) 

(II, 134) 
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Где ер = і; х°і (і — 1 , 3) — содержание «-пентана, изопентана, лег- 
ких углеводородов на входе в реактор, мольн. доли; р к — плот- 
ность катализатора, кг/м 3 ; Ѵ к — объем катализатора, м 3 ; О — рас- 
ход смеси в реактор, кг/ч; р ^ р н 2 — парциальное давление водо- 
рода в реакторе, МПа; і°, і ■ — температуры на входе в реактор и 
выходе из него, “С; ц ■ — суммарный тепловой эффект, кДж/кмоль; 
с — теплоемкость «-пентана, кДж/(кмоль °С). 

Ректификационные колонны 3, 4, 10. В математической модели 
ректификационных колонн приняты следующие допущения: разде- 
ляемая смесь — бинарная; жидкость в колонне находится при 
температуре кипения, а пар насыщенный; конденсатор для колонн 3, 
4 — полный, для колонны 10 — парциальный; колонна работает 
в адиабатических условиях; массопередача на тарелках эквимоляр- 
ная; к. п. д. тарелок принимается постоянным по всей колонне; 
относительная летучесть смеси постоянна по высоте колонны. Мате- 
матическая модель ректификационной колонны представляет собой 
следующую систему уравнений [43, с. 18]. 

Уравнение общего материального баланса колонны 

Д = Д+ «7 (И, із5) 

Уравнение материального баланса колонны по легколетучему 
компоненту 

Рх р = Ох р + ( 11 , 136 ) 


Уравнение материального баланса і-той тарелки по легколету- 
чему компоненту 


*і=--(ѴУи. + Ѵ*ѵ)/(Ѵ + Ѵ) '</ (11,137) 

х і = І ѵ Уиі + Ѵ-Я)І : У р -1>х 0 ]/ІѴ + (1-д)Р-Оі І = І (11,138) 

х і = ( ѵ Уі-і-° х о)/(Ѵ~°) '■>/ ( И . 139 ) 

Уравнение фазового равновесия 

У * «= “VI 1 + (“—!) V (II, 140) 

Состав паровой фазы с учетом к. п. д. тарелки 

Уі = У (-1 + {Уі — У{- 1) И (И, 141) 


Здесь і — номер тарелки; / — номер тарелки питания; Р — расход 
питания, кмоль/ч; Б — отбор дистиллята кмоль/ч; 1У — отбор ку- 
бового продукта, кмоль/ч; V — поток пара в колонне, кмоль/ч; 
х г , х п , лѵ — содержание легколетучего компонента в питании, 
дистилляте, кубовом продукте, мол. доли; х ь — содержание легко- 
летучего компонента в жидкой фазе на і-той тарелке, мол. доли; 
Уі — содержание легколетучего компонента в паровой фазе на і-той 
тарелке, мол. доли; у р — содержание легколетучего компонента в 
паровой фазе питания, мол. доли; у * • — равновесное содержание 
легколетучего компонента в паровой фазе на і-той тарелке; ц — доля 
жидкой фазы в питании; а — относительная летучесть компонентов; 
т) — к. п. д. тарелки. Для расчета ц, у р используется уравнение 
(II, 146) (см. модель сепаратора). 
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В зависимости от постановки задачи в качестве независимых 
переменных может быть принята любая пара из следующих вели- 
чин: %/, х в , Я, V. Определение оставшихся неизвестных величин, 
при заданных значениях независимых переменных сводится к ите- 
рационному решению системы уравнений (II, 135)— (II, 141). Зна- 
чения температур дистиллята и кубового продукта, необходимые 
для расчета теплового баланса ХТС, определяются из решения 
уравнения изотерм [44, с. 58] 

для кубового продукта 

2 к і ( т ) х т ~ 1 = 0 (И, 142) 

/ 

для дистиллята 

2 к і (Т) х ]0 - 1 = 0 (11,143) 

/ 

где к } ( Т ) константа фазового равновесия /-той компоненты, являю- 
щаяся функцией температуры; х № , х іо — содержание /-той компо- 
ненты в кубовом продукте и дистилляте, мол. доли. 

Колонна азеотропной осушки 5. Предполагается, что расходы и 
составы исходной и осушенной н-пентановой фракции одинаковы. 
Температура осушенной н-пентановой фракции, покидающей куб 
колонны, рассчитывается по уравнению изотермы (II, 142). 

Адсорбер 14. Предполагается, что все параметры (за исключе- 
нием давления, поступающего на осушку в адсорбер водородсодер- 
жащего газа), не претерпевают изменений. Давление на выходе из 
адсорбера рассчитывается по формулам [44, с. 214]: 

_ „ &ѵ ь ын а 

Рвых - Рвх 2 Т 1 = Ш ^Д3600Д 144 ) 

Х= Те°'2 ПРИ Ке = ДГ* >40 (11,145) 

где Рвых. Рвх — давление на выходе и входе адсорбера, МПа; ^ — 
коэффициент сопротивления; к = 27,8 — коэффициент, зависящий 
от диаметра зерна; Я — высота слоя цеолитов, м; й 3 — диаметр 
зерна, м; ш — линейная скорость газа, м/с; у — удельный вес газа, 
кгс/м 3 ; О — расход газа, кг/ч; Р — площадь свободного сечения 
колонны, м 2 ; § — ускорение свободного падения, м/с 2 ; ѵ — кине- 
матическая вязкость газа, м 2 /с; К — коэффициент трения, завися- 
щий от критерия Рейнольдса. 

Сепараторы 14, 21, 24. Математическая модель сепаратора пред- 
назначена для расчета количеств и составов жидкой и газовой фаз 
при заданных значениях состава, температуры и давления потока, 
поступающего на разделение в сепаратор. Для этого необходимо 
определить корень уравнения [44, с. 71 ]: 

Ш = $ Т-ДД Г ') -1-0 ( „,М6) 

где <7 — искомая доля жидкой фазы; г * — - мольная доля і-той ком- 
поненты исходной смеси; кі = й, (/, р) — константа фазового рав- 
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новесия і-той компоненты, являющаяся функцией температуры и 
давления. Корень ^ уравнения (II, 146) лежит в пределах 0 < <7 < 1. 
Если при < 7=1 / (< 7 ) < 0 , то весь поток, поступающий на разделе- 
ние, находится в жидкой фазе. Если 0 << 7 < 1 , то 


Уі = 2 іѴ ’)! ^ 


: Уі/кі 


:дР 


о = р- 


Если <7 = 0, то Уі = 2 Ь О = Р. Если <7 = 1, то х г = г ы Ь = Р; 
здесь х ь — мольные доли і-той компоненты в жидкой и газовой 
фазах соответственно; Р, Ь, О — количества исходной, жидкой и 
газовой фаз соответственно. 

Компрессор 18. При заданной степени сжатия компрессора, тем- 
пература на выходе из него вычисляется по формуле [44, с. 48]: 

" г “ (і^г)"" 57 тД" - Ц Т-ГГТ <ч. 1«) 

і 

где Г вх , Гвых — температуры на входе и выходе компрессора, К; 
Рвх. Рвых — давление на входе и выходе компрессора, мПа; ч\ р — 
политропный к. п. д. компрессора; к — ■ показатель адиабаты; кі — - 
показатель адиабаты для і-той компоненты смеси; х ь — содержа- 
ние і-той компоненты в смеси, % (масс.) 

Смесители потоков 2, 6, 7, 17, 20. Количество и состав выход- 
ного потока рассчитывается по формулам: 

бвых = 2 б вх і *вых І = 2 (^вх І Х ЪТ' 1 < і/О вых) (II, 148) 

/ / 

где С вхі — количество /-го потока, кг/ч; х вх!іі — содержание і-той 
компоненты в /-том потоке, % (масс.). Температура выходного по- 
тока рассчитывается итерационно по уравнению 


2 ' 


вх / и вх ] с вк і 


■ 


ОвыхСвых ( П ’ 149 ^ 

где (вх ; — температура /-го входного потока, °С; с вх у — теплоем- 
кость /- го входного потока, кДж/(кг-°С); с вых — теплоемкость 
выходного потока, которая является функцией выходной темпе- 
ратуры. 

Целитель потока 19, 8. Количества, составы и температуры 
выходных потоков рассчитываются по формулам: 


; Р]0в 


*В Ы Х І — *вх і 


'вых 3 ■ 


(II, 150) 


где Я] — коэффициент делителя для /-го выходного потока, 2 = 

, / =1 
— 1 1 *в Х і — содержание г-тои компоненты во входном потоке, % 

(масс.); .ѵ вых ^ г — содержание і-той компоненты в /-том выходном 
потоке, % (масс.); т — число выходных потоков. 

Делитель потока 8 рассчитывается после определения С Т для 
рекуператора 1 . 
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Теплообменники 1, 9, 11, 16, 22, 23, 25. Математическая модель 
рассматриваемых аппаратов описывается следующей системой урав- 
нений [45, с. 113]: 

А = ° ТсТт 1п/(0 ХсХ »1п) г — У (1 + А) 2 — 4рА (11,151) 

0 Т с Т г] в 0,5 (г + Л + 1) + г (11,152) 

^вых ^вх ® (^вх ^вх) (II, 153) 

^вых = *вх + ФЛ ( { 1х ^вх) (II, 154) 

где А, г функции водяных эквивалентов; 5 — число единиц пере- 
носа тепла; Ф — функция тепловой эффективности; / вых , С.х — 
конечная и начальная температуры теплового теплоносителя, °С; 

дХ ,Х 

1 вь:х, ‘вх - конечная и начальная температуры холодного тепло- 
носителя, °С; С т , 0 х — - расходы теплого и холодного теплоносите- 
лей, кг/ч; с т , с х — теплоемкость теплого и холодного теплоноси- 
телей, кДж/(кг- С); г)п, г|п — коэффициенты потерь теплового и 
холодного ° теплоносителей; к — коэффициент теплопередачи, 
кДж/(м 2 -ч-°С); Р — площадь теплопередачи, м 2 ; р »- индекс про- 
тивоточности ^(для теплообменников 1, 9, 11, 16, 22, 25 с противо- 
точной схемой /?=1, для аппарата 23 с перекрестным током и разде- 
лением одной среды на отдельные струи р = 0,57). 

Для аппаратов 9, 11, 22, 23, 25 при заданных значениях началь- 
ных температур и расходов теплоносителей неизвестными являются 
конечные температуры теплоносителей, которые легко рассчиты- 
ваются по приведенным формулам. Для обеспечения регламентного 
режима работы колонны азеотропной осушки 5 и адсорбера 14 в ап- 
паратах 1, 16 необходимо поддерживать заданную конечную тем- 
пературу холодного и теплого теплоносителей соответственно. 
С этой целью для аппарата 1 рассчитывается расход теплого тепло- 
носителя по уравнениям (II, 151), (II, 152), (II, 154), а для аппа- 
рата 16 расход холодного по уравнениям (II, 151)— (И, 154). За- 
дача решается итерационно. После расчета О т для аппарата 1 по 
уравнению (II, 153) рассчитывается ^ ых . Если для рекуператора 1 
рассчитанное значение С т больше потока, поступающего в дели- 
тель 8, то С т принимается равным этому потоку и по уравнениям 
(II, 151)— -(II, 154) вычисляются конечные температуры обоих тепло- 
носителей, соответствующие принятому расходу. 

Пароперегревательная печь 12. Математическая модель этой 
печи описывается уравнением 

бс Евых ^вх) = О т . г ДЯт) (II, 155) 

где О ^расход смеси в печь, кг/ч; с — теплоемкость смеси, 
кДж/(кг-°С); / ВЬІХ , / вх — температура на выходе и входе печи, °С; 

г расход топливного газа в печь, кг/ч; АН — теплотворная 
способность топлива, кДж/кг; т) — к. п. д. печи. 

Постановка задач расчета. При расчете и оптимизации стацио- 
нарных режимов ХТС важным вопросом является выбор незави- 
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симых поисковых переменных. При традиционном подходе в каче- 
стве независимых поисковых переменных принимаются управляю- 
щие переменные аппаратов системы; для ректификационных колонн — 
это расход пара V и отбор дистиллята В, в теплообменниках — 
расход хладоагента, в печи — расход топливного газа. Расчет ста- 
ционарного режима сводится к расчету материального и теплового 
балансов ХТС при заданных значениях управляющих переменных. 
Однако в данной постановке возможны случаи, когда на некотором 
итерационном шаге расчета ХТС, особенно это касается методов, 
в которых наблюдается колебательная сходимость, отсутствует 
решение для отдельного аппарата. К примеру, сильное уменьшение 
потока сырья, поступающего в реакторный узел при заданном зна- 
чении поисковой переменной (расхода топливного газа в печь), 
может привести к значительному возрастанию температуры этого 
потока. Это может явиться причиной отсутствия решения для мо- 
дели реактора. При фиксированных значениях поисковых пере- 
менных (отбор дистиллята и расход пара в колонне), сильное изме- 
нение параметров питания, поступающего на разделение, может 
привести к отсутствию решения для модели ректификации. Коррек- 
тировка значений расхода топливного газа в печь, отбора дистил- 
лята, расхода пара в колонну с целью получения решения затруд- 
нительна и может быть достигнута только методом проб и ошибок. 
Этих затруднений можно избежать, если в качестве поисковых 
переменных принять некоторые фазовые переменные. В качестве 
поисковой переменной модели реакторного узла целесообразно 
принять температуру на входе в реактор, на которую наложены двух- 
сторонние ограничения, обеспечивающие условия физической реали- 
зуемости процесса изомеризации «-пентана, в модели ректифика- 
ции концентрации легколетучего компонента в дистилляте и 
кубовом продукте. Тогда при заданных х Р , Р, і р необходимо опре- 
делить В, У, обеспечивающие заданные составы верхнего х аз и 
нижнего продуктов. Отбор дистиллята, обеспечивающего за- 
данные составы продуктов разделения, вычисляется из уравнения 
материального баланса: 

п = р { х р ~ •%з )' / ( х о — % 3 ) (Н, 156) 

Количество пара, необходимое для обеспечения заданных со- 
ставов продуктов разделения, определяется из потарелочного рас- 
чета итерационным решением уравнений (II, 137)— (Ц, нп кохо . 
рые обобщенно записываются в виде: 

х оз~ х о( р > ѵ > х г> * Р ) = 0 (11,157) 

Если на некотором итерационном шаге расчета ХТС окажется 
что в уравнении (II, 156) х Ѵз У> х Р , а следовательно физически 
реализуемое решение отсутствует, этот недостаток можно легко 
скорректировать, приняв для данного шага, что х т <5 х Р . 

Замена традиционных поисковых переменных некоторыми фазо- 
выми переменными приводит к следующей постановке задачи рас- 
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чета стационарных режимов ХТС. При заданных значениях поиско- 
вых переменных необходимо рассчитать материальный и тепловой 
балансы ХТС, а также управляющие воздействия (расход топлив- 
ного газа в печь, расходы пара и отборы дистиллятов в ректифика- 
ционных колоннах, расходы теплового теплоносителя в рекупера- 
тор^ 1 и холодного в холодильник 16), которые обеспечат стационар- 
ный режим. Напомним, что для рекуператора 1 в качестве поиско- 
вой переменной принята температура холодного теплоносителя, 
а для холодильника 16 — температура теплого. 

Обсуждение результатов расчета. Для расчета стационарного 
режима схема приведена к условно разомкнутому виду. Размерность 
вектора разрываемых потоков равна 9. На рис. 8 места разрыва 
потоков обозначены римскими цифрами. Элементами вектора для 
потока I являются покомпонентные расходы и температуры, 
дляпотоков II— IV — температуры. Были использованы методы про- 
стой итерации (РКП), доминирующего собственного значения 
(О ЕМ), модифицированный метод Вольфа (\ѴОЬР), квазиньютонов- 
ский метод ((^ИМ), обобщенный метод доминирующего собственного 
значения (СЮЕМ) [23]. 

При расчете ХТС методом РКІТ решение было получено при- 
мерно за 1000 итераций, что составляло около 30 минут машинного 
времени ЭВМ ЕС-1033. При столь больших затратах машинного 
времени на расчет одного стационарного режима ни о какой оптими- 
зации режимов говорить не приходится. Поскольку в моделях рек- 
тификации при расчете одной итерации основное время затрачивается 
на вычисление расхода по уравнению (II, 157), для сокращения вре- 
мени счета был применен следующий прием. До полного сведения 
материального и теплового балансов системы в моделях ректифи- 
кации рассчитывались отборы дистиллята й и кубового продукта ѴѴ. 
В точке решения по уравнению (II, 157) вычислялось значение V, 
соответствующее заданному качеству продуктов разделения. Ана- 
логичным образом, расходы теплого теплоносителя в рекупера- 
тор 1 и холодного в холодильник 16, [рассчитываемые итерационно 
по уравнениям (II, 151) — (11,154)], обеспечивающие заданные тем- 
пературы, также рассчитывались только после сведения материаль- 
ного и теплового балансов. Значение неизвестной выходной темпе- 
ратуры теплого теплоносителя в рекуператоре 1 до полного расчета 
схемы не играет роли, так как в уравнении (II, 156) модели ректи- 
фикации, используемом на каждой итерации, агрегатное состояние 
питания не учитывается. Описанный подход позволил сократить 
время расчета схемы более чем на 30 %. 

При расчете схемы методами \ѴОЬР, С^ЫМ, ВЕМ возникали слу- 
чаи, когда прогнозируемые значения итерируемых переменных 
принимали отрицательные значения. Чтобы избежать этого, была 
произведена замена итерируемых переменных. Так, если прогнози- 
руемое значение итерируемой переменной обозначить через г, новая 
переменная принимает значение х — \г\. 

Результаты расчета ХТС изомеризации н-пентана приведены 
в таблице 6. 
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Таблица 6. Результаты расчета ХТС изомеризации Я-пентана 


Метод 

РКП 

ОЕМ 

< 3 імм 

\ѴОЬР 

СШЕМ 

Число 

итераций 

977 

59 (4) 

7(17) 

23 

45 (12) 


В строке «число итераций» для методов О ЕМ и СЮЕМ в скобках 
указано число шагов ускорения, для метода ОЫМ — число вычис- 
лений разомкнутой схемы. Начальная невязка (II, 17) составляла 
1,49- ІО 4 . Решение считалось достигнутым, если величина невязки 
составляла менее 0,01. Итерационный процесс расчета стационар- 
ного режима ХТС методом РКІТ был монотонным, вследствие чего 
работа метода БЕМ при значении критерия принятия шага ускоре- 
ния равном ІО' 3 оказалась достаточно эффективной. 

Методы С^М и \ѴОЬР дали приблизительно одинаковые резуль- 
таты. На рис. 9 приведены графики зависимости невязок от номера 
итерации. В случае применения метода СЮЕМ стрелками указаны 
шаги ускорения. Размерности базисов в случае применения мето- 
дов \ѴОЬР, СЮЕМ были приняты равными 9 и б соответственно. 
При методе \ѴОЬР базис набирался чередованием простой итерации 
и шага по чистому методу Вольфа [1, с. 35]. При завершенном ба- 
зисе заменялась точка, обладающая максимальной невязкой. Для 
метода СЮЕМ шаг ускорения принимался, когда значение крите- 
рия принятия шага ускорения не превышало ІО -7 . При методе 01ММ 
в качестве начального приближения к матрице Якоби была принята 
его разностная аппроксимация. Выбор поисковых переменных и 
связанные с ним подходы в случае расчета стационарного режима 



Рис. 9. Зависимость невязки от номера итераций, полученная С помощью методов: 

р -іѵгои?; ф - $N1^; -> - ОРЕМ. 
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ХТС изомеризации н-пентана, а также использование методов уско- 
рения сходимости позволили сократить число вычислений схемы 
примерно в 50 раз, а время решения с 30 до 3 минут. 

Для обеспечения заданных производительности установки по изо- 
пентану О и . с 6 и мольного соотношения расходов водорода и н-пен- 
тана на входе в реактор М 3 воспользуемся методом и алгорит- 
мом, учитывающим эти ограничения на одном итерационном уровне 
расчета схемы. Для этого наряду с итерируемыми переменными 
(вектором разрываемых потоков х ) ищутся такие значения расхода 
сырья (н-пентана) О п -с ъ и водорода С н . на установку, которые обес- 
печат' выполнение равенств О и . Сі = 02- с. , М = М 3 . Решаемая 
система имеет вид: 

°«-<ѵ °н,) = х 1 -Г { (х, О н . Съ , 0 Нг ) = о, г =179 (11,158) 

С н 2 )**°и-с, — /ц(*> °н- с,- °н 2 ) = м — ^8 — 0 

(II, 159) 

Решение этой системы квазиньютоновскими методами (в част- 
ности методом (^N14) возможно в случае использования в качестве 
начальной оценки матрицы Якоби его разностной аппроксимации. 

Начальная невязка составляла 1,55- 10 4 . Решение методом 
(ЗК.М было достигнуто всего за 6 итераций. При этом число вычис- 
лений разомкнутой схемы было равно 18. Из полученных резуль- 
татов очевидно, что несмотря на увеличение размерности решаемой 
системы за счет учета ограничений типа равенств на одном итераци- 
онном уровне число вычислений практически не изменилось, так 
что описанный подход значительно эффективнее многоуровневых 
алгоритмов типа «цикл в цикле» [3, с. 28]. 

Расчет больших систем 

ХТС средних размеров обычно имеется 20—30 аппаратов, а каждый 
поток в среднем характеризуется 3 — 5-ю компонентами. Поэтому 
система (II, 1), (II, 3) будет иметь размерность 60—150 [46]. Жела- 
ние более точно моделировать ХТС приводит к тому, что размер- 
ность решаемых систем нелинейных уравнений растет. В то же время, 
число итераций даже для решения линейных систем уравнений 
растет пропорционально их размерности. 

Можно предположить, что и для нелинейных систем число ите- 
раций будет расти с увеличением размерности задачи. Поэтому 
решение системы (II, 1), (II, 3) может потребовать много времени. 
Особенно это касается случая, когда при оптимизации ХТС прихо- 
дится многократно рассчитывать ее стационарные режимы для 
различных значений управляющих переменных. В связи с этим боль- 
шое значение приобретает разработка эффективных методов решения 
систем нелинейных уравнений большой размерности. 

Рассмотрим подходы к решению задач расчетом ХТС большой 
размерности. Заметим, что уменьшение размерности не должно быть 
самоцелью. Главное — это уменьшение продолжительности счета. 
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В связи с тем, что модели ХТС достаточно сложны, с некоторым 
приближением можно считать, что время, затраченное на решение, 
пропорционально числу итераций при решении системы (II, 1), (II, 2). 

Последовательный подход. Вначале рассмотрим эту проблему 
применительно к последовательному подходу. Здесь уменьшение 
размерности задачи расчета ХТС достигается методами структур- 
ного анализа [47]. При этом решаются следующие задачи: 1) в схеме 
выделяются комплексы — совокупности блоков охваченных обрат- 
ными связями [3, с. 33]; 2) определение внутри каждого комплекса 
оптимальной с точки зрения какого-либо критерия совокупности 
итерируемых переменных (II, 5). Обычно совокупность итерируе- 
мых переменных (II, 5) выбирается из условия, чтобы их суммар- 
ная размерность была минимальной. Положительные и отрицатель- 
ные стороны такого выбора переменных (II, 5) обсуждаются в ра- 
боте [3, с. 85]. Отметим здесь, что применительно к квазиньютонов- 
ским методам это более или менее оправдано, поскольку, как мы 
уже отмечали, можно считать при применении этих методов, что 
число итераций растет пропорционально размерности системы нели- 
нейных уравнений. Уменьшаются требования и к размеру памяти, 
поскольку приходится хранить одну или две матрицы размерности 
| пХп. При использовании ориентированного на уравнения подхода 
так же, как и в предыдущем случае определяются комплексы, 

I а внутри комплексов — оптимальные совокупности разрываемых 
I потоков [48; 17; 18, с. 258]. 

; Параллельный подход. Рассмотрим теперь параллельные методы 
' расчета ХТС применительно к системам (I, 1), (I, 6), или эквива- 
лентной ей системы (II, 4). Непосредственное применение квазинью- 
тоновского метода 2-го рода для решения системы (II, 4) потребует 
хранения двух (И X Л^-матриц, а число итераций, когда все модели 
линейны, будет равно N = тЫ. Поскольку обычно N > п, на 
! первый взгляд может показаться, что переход к параллельному 
г способу только ухудшит результаты. Однако, как показано ниже, 
I использование особенностей структуры ХТС, а, следовательно, 
I особенностей структуры системы (II, 4) может сделать параллель- 
? ный метод существенно более эффективным. 

} Особенности структуры ХТС. Для ХТС характерна ситуация, 
I когда каждый блок связан с небольшим числом других блоков, 
і Это значит, что в отдельное уравнение системы (II, 4) будет входить 
' только небольшая часть общего числа переменных *<*>, ( к — 1, /V). 

- Если в і-тое уравнение системы (II, 4) переменная х <*) не входит, 
то соответствующая частная производная от Р г по этой переменной 
тождественно равна нулю. Таким образом, матрица Якоби системы 
; (II, 4) будет содержать большое число нулей, и мы имеем дело с си- 
; стемами, обладающими разреженной структурой. 

Другая особенность состоит в том, что система (II, 4) имеет 
блочную структуру. Это особенно заметно, если рассматривать не 
систему (II, 4), а систему (I, 1), (I, 6), из которой она была полу- 
чена. На рис. 10 приведен вид матрицы Якоби для систем урав- 
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Рис. 10. Вид матрицы Якоби си- 
стемы ^ уравнений (II, 4), описы- 
вающей схему, приведенную на 
рис. 5. 


нений (II, 4) применитель- 
но к схеме, показанной на 
рис. 5. Первые т столбцов 
соответствуют входным 
переменным 1-го блока, 
вторые т столбцов — вход- 
ным переменным второго 
блока и т. д.; первые т 
строк — уравнениям 1-го 
блока, вторые т строк — 
уравнениям 2-го блока 
и т. д. Заштрихованные 
участки соответствуют ненулевым элементам, незаштрихованные 
части — нулевым элементам. 

Следующая особенность состоит в том, что многие элементы 
матрицы Якоби имеют известные постоянные значения. Так, многие 
элементы в матрице Якоби, показанной на рис. 10, равны единице. 

И, наконец, последняя особенность состоит в том, что матрицы 
Якоби правых частей уравнений (I, 1) для многих блоков легко 
могут быть вычислены. 

При построении квазиньютоновских методов желательно учесть 
как можно больше свойств самой матрицы Якоби. Общим для этих 
методов является то, что строится аппроксимация самой матрицы 
Якоби, а не обратной. Это связано с тем, что сама матрица может 
иметь большое число нулевых и постоянных элементов, в то время 
как обратная обычно является заполненной, имеющей мало нулевых 
и постоянных элементов. Идея построения квазиньютоновских ме- 
тодов, учитывающих разреженную структуру систем нелинейных 
уравнений, состоит в том, чтобы при построении матриц (і = 1, 
2, ...) сохранена была структура самих матриц Якоби, т. е. если 
некоторый элемент матрицы Якоби равен нулю, то и соответствую- 
щий элемент матрицы В { должен быть равен нулю. То же требова- 
ние относится к случаю, когда элемент матрицы Якоби является 
либо легко вычисляемым, либо постоянным. Все дальнейшее изло- 
жение будет вестись применительно к параллельному методу рас- 
чета ХТС. 

К вазиньютоновские методы 1 рода для решения 
разреженных систем нелинейных уравнений 

Обозначим через Л4, множество пар целых чисел (і, /) таких, что 
соответствующий элемент /!/ ) матрицы равен некоторой постоян- 
ной р і]} не зависящей от точки, а следовательно, и номера итера- 
ции (в частности р и может быть равно нулю), т. е. 

П) = Ріі> («. /)€Мі 


г (2) 



О 


О 


О 
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(II, 160) 



Обозначим через М 2 множество пар (і, /) таких, что соответствую- 
щие элементы легко вычисляются. Введем множества М, И: 
М = МіЦМ-2, М = {(і, /) : (/, /) ф М г ) 

Наша задача состоит в построении такой матрицы В к+Ъ эле- 
менты Ь\; + \ (к = 0, 1, ...) которой удовлетворяют соотношениям: 

Рі,і б', /)€М і 

/( - +І) (і, і) € М 2 (П ’ 161) 


: 

ч 


Матрицу В к+1 будем искать в виде (II, 38). Ясно, что элементы 
1(г, /) ^ М] этой матрицы удовлетворяют соотношениям: 

0. (і, І)^Мг (И, 162) 

/<*+і> _ /<*> = Д /<*> (*, /) € ЛІ 2 (II, 163) 

Для определения матрицы Вй +1 опять применим принцип наимень- 
шего изменения матрицы В к . Тогда задача определения матрицы Е 
будет выглядеть следующим образом: 


/=і 


N N 

ч 1 = 1 /= 1 

(П, 164) 

— — 

е и 5 7,к = Гі >к 1 = 1, N 

(II, 165) 

е Ч = 0 (і, і)^Мі 

(II, 166) 

и V, і)$м а 

(И, 167) 


г Де г и к і - тая компонента вектора г к , определяемого формулой (II, 40). 
Рассмотрим вначале случай, когда М 2 = 0. Преобразуем усло- 
вия (II, 165). Вектор-строку 5 (г) с элементами 5 (і')- [5 (і) =5 (і) 1 
I введем следующим образом: 


5 (0/ 


(II, 168) 


(И, 169) 


5 /, й 0'. /)€М 

о, («, /)6М 

Подставляя в уравнения (II, 165) значения е*,-, удовлетворяющие 
условию (II, 162), получим 

^1_ е Ч 8 і> к — г і,к 

Если использовать вектор 5 (г), эти соотношения могут быть пере- 
писаны в виде: г 

77 

Ц е іі 8 (0/ = П, к і = 1, N (II, 170) 

/=і 

Как видно из дальнейшего, запись условий (II, 165) в виде (II, 170) 
обеспечивает автоматическое выполнение условий (II, 166), поэтому 
соотношения (II, 170) эквивалентны соотношениям (II, 165), (II, 166). 
Заменяя в задаче (II, 164)— (И, 166) условия (II, 165), (II, 166) 
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соотношениями (Н, І70) и учитывая, что М, т 0, сводим эту 
задачу к следующей: “ у 


N N N 

™ іп I] И е Ь е</мо/^«,й 

е и »■= і ;=і /= і 


(II, 171) 


Соответствующая функция Лагранжа имеет вид 


N N Л' ГЛ' 

2 ѵі 

1 = 1 /=1 1 = 1 Ь / = 1 


>')/■ 


С,* 


(И, 172) 


Приравнивая производные от Ь по элементам е,-, нулю, получим 

е Ч = ~ ( 0 / ( 11 , 173 ) 

Поскольку 5 (і')у = 0 для (і, у) ^ М ь то е ьі = 0 для ( і , у) ^ Л1 2 . 

Подставим из формулы (II, 173) в выражение (II, 170), по- 
лучим 

Г/, к 


7ч 


Отсюда 


е і/ — ^ і , к 


Ві (1) т 5 (0 
5 (І)і 


В (1) Т 5 (1) 

Обозначим через е* строчку матрицы У:, тогда 

в(і) 


(И, 174) 


«і = П, к 


з(і) т з (і) 


(II, 175) 


Обозначим через Ь\ к) і - тую строчку матрицы В к ; тогда из уравне- 
ния (II, 38), используя формулы (II, 40), (II, 10), (II, 22), получим: 


О — &(*) _р 


ІЛ-.й+і— (1— а й ) [і г к]з(і) 


(И, 176) 


* (0 Т * (0 

Эта формула выведена Шубертом [49], но другим путем. Ясно, 
Ч (І+і> еСЛИ [к) ^ ^ Т ° е " = 0 в соответствии с (II, 168). Поэтому 
Ь{і) ~ (к 1 {) ^ ЛЯ ^ ^ Аналогично можн ° показать, что 
Ьц = Ьц Д ля (С /) С и т. д. Таким образом, если в началь- 
ной матрице В 0 элементы Ъ } у 0) = р ц для (г, у) ^ М и то и для всех 
последующих матриц соответственные элементы будут равны вели- 
чинам р и . 

Рассмотрим теперь случай, когда множество М 2 не пусто. В этом 
случае соотношение (II, 169) будет иметь вид: 

2] _ е Ч 5 і, ь + 2 е Ч в і, ъ = г і, к 

(і, і) € м (О /)€м 2 


(II, 177) 


Ясно, что вторая сумма в левой части равенства (II, 177) является 
известной величиной [см. выражение (II, 163)]. Запишем равен- 
ство (II, 177) в виде: в 


2] _ е 4 в і, к ~~ , к 

и, /) 


(II, 178) 
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1 


4 

$ 

I 

| 

к 

I 


где П> к г і , к 2 Д/1/Ч, а при і — У, N — известные ве* 

и. і)^м 2 

личины. Введем новые переменные ё і ^ 


ёіі = 



(‘. І)€М 

и. і)$м 


(II, 179) 


Соотношения (II, 178) с учетом выражений (II, 168), (II, 179) могут 
быть переписаны в виде: 

N 

Е е Ч в ( 1 )і = ? і, к (11,180) 

По построению соотношение (II, 180) эквивалентно соотношениям 
(II, 165) (II, 167). Заменяя в задаче переменные с г ,- на перемен- 
ные е і7 -, а соотношения (II, 165) — (II, 167) — соотношениями (II, 180), 
сведем задачу (II, 164)— (II, 167) к виду: 


ЛС N 

тіп ЕЕ ё ?/ (П. 181 ) 

е ц «=і /= 1 
N 

2 *</* (0/ ^ № 

І- 1 

Задача (II, 181) совершенно идентична задаче (II, 171). Поэтому 
по аналогии с предыдущим случаем [см. выражение (И, 175)] по- 
лучим: 

П,кЗ{і)і 

ёі і — : 

I (0 .* (0 


Отсюда, используя переменные (II, 179), (II, 162), (II, 163), подсчи- 
тываем элементы матрицы В к+1 : 


Ь(*.+» = 
ч 


Ріі 

;(*-Н) 

'</ 



(0 /) € Мг 
(0 /) € Щ 
(0 /) € М 


(И, 182) 


Полученные формулы (II, 176), (II, 182) являются обобщением 
формулы Шуберта на случай наличия в матрице В к постоянных и 
легко вычисляемых элементов. 

Отметим одну особенность. В методе Бройдена рекуррентное 
соотношение (II, 47) записывается для всей матрицы сразу. В дан- 
ном же случае рекуррентное соотношение записывается отдельно 
для каждой строчки матрицы В к . Это связано с тем, что вектор 5 (і) 
Ісм. соотношение (II, 168)] зависит от номера строки і. После того, 
как матрица В к будет определена, необходимо решить систему ли- 
нейных уравнений (II, 22) для определения направления движения р к . 
Система (II, 22) будет системой с разреженной структурой и для 
ее решения должны быть, использованы специальные методы [36]. 

Один из подходов к решению разреженной системы (II, 22) со- 
стоит в следующем. Для системы (II, 22) проводится структурный 
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анализ, в результате чего находится совокупность итерируемых 
переменных (II, 5), обладающих минимальной суммарной размер- 
ностью. Далее, относительно итерируемых переменных решается 
система (II, 6 ), которая в данном случае является линейной 1см. 
выражение (II, 20) ]. Вид матрицы А и вектора Ь неизвестен, и только 
по заданному х можно найти / (х) = Ах + Ь. Для решения системы 
(II, 20) могут быть использованы формулы (II, 101), (II, 102). 

Для . ХТС с блоками, описываемыми нелинейными моделями, 
интересно выяснить, что лучше для разреженной системы нелиней- 
ных уравнений (I, 1 ), (I, 6 ): провести структурный анализ и свести 
дело к решению системы нелинейных уравнений (II, 8 ) и далее 
применять обычные квазиньютоновские методы, или же подойти 
к ней, как к системе с разреженной структурой и применять спе- 
циальные квазиньютоновские методы, а структурный анализ при- 
менять для «сжатия» линейной системы (II, 22). 


Квазиньютоновский метод с памятью решения 
разреженных систем нелинейных уравнений 


Квазиньютоновский метод с памятью для решения неразреженных нелинейных 
систем был рассмотрен ранее. При этом элементы матрицы Е находились как реше- 
ние задачи (11,82), (11,83). В данном случае элементы матрицы Е будут находиться 
так же, но при наличии дополнительных условий (11,162). По аналогии с соотно- 
шениями (11,168) введем вектор-строку « (і) т с элементами $(<); т , причем сделаем 
это следующим образом: ’ 


5 0')/, т =* 


*у, т 
0 


(<'. І)€М 
(«'. /)€Л*і 


(II, 183) 


где т — номер итерации. По аналогии с соотношением (11,170) соотношения (11,83) 
могут быть записаны в виде: 


N 

2 ®< 7 ® О )/ , т — сі, т т = к, к — 1 , ...,к — <7 + 1 

/=і 


или в векторной форме: 


- 8 ( ( )т е 1 = г 1>т т = к, к— 1 6 — < 7+1 іт\, N (11,184) 

Функция Лагранжа будет иметь вид 


N <? N 

1 = 4 - 2 е і е і + 2 2 і ‘ р)$ Мк-р+і-*' 

і — 1 р — 1 /=1 

Приравнивая производные Ь по ец нулю, получим 


е і ' “ 2 ( 1 )к—р + 1 

1 

Подставляя это выражение для е; в соотношение (11,184), получим систему М 7 линей- 
ных уравнений для определения Тід величин Я) р) (р = 1 , < 7 ; і = 1 , д 7 ). 


- 2 Я( р) « (і) т з (і)1 

р= 1 


Р +1 


< " 1 , А' , т = к к — <7 + 1 
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(II, 185) 


Конечно, система (11,185) получилась сложнее системы (11,85). Однако и здесь бла- 
годаря специальной структуре можно существенно упростить процедуру решения. 
Действительно, система (11,185) может быть записана в следующем матричном виде: 

+ 5 и аЯ + • • • + З 1д к«> = ~г к 

(II, 186) 

-V + ••• + 5 ОТ Л (<7) = ~Г к _д +1 

где Я (/) — вектор множителей_ Лагранжа, соответствующих /'-му условию (11,83), 
а Зрі диагональная (Л/ X /Ѵ)-матрица. Диагональный элемент этой матрицы, 

стоящий на і-том месте, имеет вид: 5 (і)^_ р+1 5(і)^, +1 . Матрица системы (11,186) 

имеет клеточную структуру, каждый элемент ее 5;/ сам является матрицей, 
пт .цР едполож ™> что все матрицы 5;/ не вырождены; тогда для решения системы 
1 і,іоо) может быть применен матричный вариант метода исключения Гаусса. При 
этом, так же, как и в обычном методе исключения, матрица системы (11,186) сначала 
приводится к треугольной матрице (правда, в данном случае клеточной), после чего 
начинается процесс определения векторов Х (/> (/=ТГі/). 

Квазиньютоновский метод с блочной аппроксимацией 

Данный метод будет основан на использовании блочной струк- 
туры системы (I, 1), (I, 6). Откажемся от формирования приближе- 
ния для всей матрицы Якоби системы (I, 1), (I, 6) сразу и будем 
строить аппроксимации отдельно для матриц Якоби правых частей 
каждого из соотношений (I, 1) [50, 26], используя информацию 
о входных и выходных переменных данного блока, которую полу- 
чим во время проведения итерационной процедуры решения си- 
стемы (1,1), (I, 6). Интересно отметить, что в предыдущем случае 
также пришлось отказаться от построения аппроксимации для 
всей матрицы Якоби сразу и перейти к построчной аппроксимации. 

Вначале рассмотрим случай, когда размерности всех вхбдных и 
выходных потоков блоков равны п к — т к — щ. Обозначим через х\ к \ 
г\ к) значения векторов х (к) на і-той итерации. (Надеемся, что не 
возникнет путаницы, связанной с тем, что в остальных главах че- 
рез х\ \ г {к) обозначались соответственно і- тая входная и выходная 
переменные к-го блока). Введем обозначения 

У {к) = - г)*' 5 <*> = *<*>, _ *(*> (II, 187) 

Будем считать, что итерируемые переменные являются перемен- 
ными I X < (^ — И №). По аналогии с матрицами Уі$і [см. выраже- 
ние (II, 27) [ введем матрицы 

№ №) -(«$*> .&) ( 11 , 188 ) 

Обозначим через В\ к) некоторую аппроксимацию матрицы Якоби 
правых частей соотношения (I, 1) на (-той итерации. Тогда, при 
тех же предположениях, при которых было получено матричное 
уравнение (II, 29) и используя тот же самый вывод, можно получить 
матричное уравнение для определения В\ к) 

в \ к) 5^>=Г) А) (11,189) 
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Для определения В\ * из уравнения (II, 189) мы можем восполь- 
зоваться формулами (II, 103), (II, 104), либо любым другим анало- 
гом формул (II, 90), (II, 91), выписанным для определения мат- 
рицы В і+1 . После того, как на і-том шаге будут определены все В\ к \ 
необходимо найти приращения Ах \ к) , Аг\ к) , с помощью которых будут 
определены следующие приближения для х\ к \ г\ к) . Это аналог 
операции определения Ах і с помощью уравнения (II, И) в методе 
Ньютона и операции определения из уравнения (II, 22) в обычном 
квази ньютоновском методе. 

Из уравнений (I, 1), (I, 6) с точностью до бесконечно малых 
второго порядка имеем: 

*{*) + Ц к) = /'*> (*<*>) + •/<*> Ах<*> (II, 190) 

Лл 'Г’ -. V Ъі . \ 2 </> (11,191) 

/=л 

В уравнении (II, 190) заменим матрицу Якоби ^\ к) ее аппрокси- 
мацией В (к) : 

Дг<. 4) = В\ к) &х\ к) + / (А > (х<*>) — г\ к) (11,192) 

Решив систему линейных уравнений (II, 192), (II, 191), найдем 

выражения Ах\ к) , Аг\ к) , после чего новые приближения для х (к) 
подсчитаем по формулам: 

*і-+і = х \ к) + “ & х \ к) гЗД = + а Дг<*> (II, 193) 

Система линейных уравнений (II, 191), (II, 192), как правило, 
имеет разреженную матрицу коэффициентов, поэтому для ее реше- 
ния могут быть использованы также специальные методы [36]. 

К решению этой системы можно подойти и по-другому. Дей- 
ствительно, системе уравнений (II, 191)', (II, 192) можно дать сле- 
дующую схемную интерпретацию. Ее можно рассматривать как 
математическую модель системы, структура которой совпадает 
со структурой исходной ХТС, а модели блоков [см. соотноше- 
ния (II, 192)1 — линейны. Отсюда, для решения системы (II, 191), 
(II, 192) удобно использовать последовательный способ расчета ХТС. 

Данный метод обладает следующими свойствами. 

1. Автоматически учитывает все нулевые элементы матрицы 
Якоби системы (I, 1), (I, 6), которые находятся вне матриц Якоби /<*>, 
(к = 1, А) отдельных блоков. 

2. Легко позволяет учесть случай, когда матрица Якоби для 
какого-либо , блока либо состоит из постоянных элементов, либо 
легко рассчитывается. Действительно, пусть для блока к легко рас- 
считывается его матрица Якоби тогда в уравнении (II, 192) 
к- го блока мы будем использовать не В \ к) , а саму матрицу / <А) . 

3. Обладает т-шаговым свойством линейного окончания ( т — - 
размерность одного потока). Действительно, рассмотрим следующий 
гипотетический случай. Пусть все модели блоков ХТС линейны и 
имеют вид (И, 3), но виды Л Кк) и Ь (к) неизвестны, можно только вы- 
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числить г <« по заданному значению *<*>. Задача состоит в восста- 
новлении вида Л< и Ы к) на основании информации о г (*> и *(*> 
которую получим во время итерационного расчета ХТС. Как видно’ 
она очень близка к задаче регрессионного анализа, когда по извест- 
ным входным и выходным переменным некоторого объекта требуется 
построить его линейную модель. Так же, как и было доказано ра- 
венс тво (II, 10 5), в этом случае легко показать, что если векторы з\ к) 

(і = 0, т — 1) линейно независимы, то на т-том шаге будет 
выполняться равенство ^ 

( 11 , 194 ) 

/?т е 3 ,™ еН -г ИЯ В( ‘ к) і‘ = 1 > т ) подсчитываются по формулам (II, 103) 
(П, 104). Іаким образом, на т- том шаге будут определены все А <*)’ 
В этой же точке можно подсчитать вектор Ы к > из соотношения (II 3) ' 
поскольку 2 <*> и *<*> в этой точке известны, а матрица А<*> уже 
определена. Поскольку после этого в каждом блоке будут опреде- 

ре*„ 6 :к Т ТС РеШеНИеМ СИСТеМЫ <“■ 3) ' (І ' 6 » " айдаи 
Рассмотрим теперь случай, когда размерности т к входных и 
выходных потоков различных блоков не равны. Обозначим через к к 
номера блоков, для которых т к принимает соответственно наиболь- 
шее и наименьшее значения. Для нахождения матриц Я<*> аппрок- 
симирующих матрицы Якоби /<*>, используем описанную выше про- 
цедуру, а для определения В<*> из уравнения (II, 189) будем исполь- 
зевать формулы (II, 103), (II, 104), Тогда при 'і < щ процесс реше- 
ния не будет ничем отличаться от описанного выше. При і = т= 

будет сформирована матрица Якоби ^-го блока. Однако поскольку 
матрицы Якоби всех остальных блоков еще не будут сформированы 
процесс решения должен быть продолжен. Мы видели (см с 000)’ 
что применение формул (II, 103), (II, 104) при і > т % будет давать 
равенство В ( * У<*>, і щ. Аналогичная ситуация характерна 
для всех остальных блоков к Ф к. Отсюда при і — т к получим точ- 
ные значения матриц Якоби для всех блоков, а, следовательно на 
(т к + 1)-вом шаге будет получено решение системы (II, 3), (і’ 6). 
Применение метода может натолкнуться на затруднения, если в’ка- 
ком-либо блоке (например, в к-тои) последовательные векторы 
5 1 ( 1 — 0, 1, ■■■, т к ) окажутся линейно-зависимыми или близкими 

к линейно-зависимым. Действительно, матрица В\ к) определяется 
из матричного уравнения (II, 189) и, если векторы близки к ли- 
нейно-зависимым, то матрица будет близка 
ной, и определение В\ к) из 
нено. 

Рассмотрим теперь случай, когда блок может иметь более чем 
один вход или выход. Этот случай легко сводится к предыдущему 
Действительно, рассмотрим, например, случай, когда А-тый блок 
имеет один входной и два выходных потока, характеризуемые 
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к вырожден- 
уравнения (II, 189) затруд- 


векторами г (4І) , 2 (И) . Математическая модель блока имеет вид 
2 (&') ** /<А» (*(*)) 2 (И) = ^Ш) ( х ОО) (11,195) 

Тогда формально можем считать, что имеются два блока, входные 
потоки которых характеризуются одним и тем же вектором х ( *>, 
а выходные — векторами г (АІ) , г ( * 2) соответственно. После этого мы 
можем применять описанный выше подход, аппроксимируя отдельно 
матрицы Якоби правых частей равенств (II, 195). 

Используем теперь ту же самую гипотетическую схему, что и при 
рассмотрении свойства 3, для сравнения последовательного под- 
хода с параллельным, при котором используется квазиньютонов- 
ский метод с блочной аппроксимацией. В . дальнейшем будем назы- 
вать этот подход параллельным методом. При использовании после- 
довательного метода в сочетании с любым квазиньютоновским ме- 
тодом 2-го рода потребуется п шагов (здесь п — суммарная раз- 
мерность разрываемых потоков) для определения решения системы 
(II, 3), (I, 6); при этом потребуется 2/г 2 ячеек памяти для хранения 
матриц Я, и Кі- При параллельном методе, как мы видели, для 
определения решения системы (II, 3), (I, 6) потребуется т шагов 
( т — размерность одного потока). Это очень интересный факт. 
В данном случае число итераций определяется не общей размерностью 
системы, которая может быть очень большой (в данном случае она 
равна 2 Ит), а максимальной размерностью потока (блока). Причем 
при усложнении структуры ХТС (увеличение числа обратных свя- 
зей) величина п может существенно возрасти, что в свою очередь 
приведет к увеличению числа итераций при использовании после- 
довательного метода. В то же время при параллельном подходе число 
итераций будет определяться только размерностью т одного потока, 
независимо от сложности" структуры ХТС. Конечно, эти выводы 
верны только для линейных систем, однако подобное свойство рас- 
смотренных методов может проявиться и при решении систем, близ- 
ких к линейным. Параллельный метод потребует 2 УѴт 2 ячеек памяти, 
поскольку в каждом блоке для определения В\ к) необходимо исполь- 
зовать две матрицы см. выражения (II, 103), (II, 104). Отсюда ясно, 
что при т < п и применении параллельного метода число итераций 
будет меньше. При этом параллельный метод будет требовать мень- 
шего объема памяти, если т У 2 N < п. 

Отметим теперь сравнительные достоинства и недостатки; по 
сравнению с методом Шуберта данный метод обладает следующими 
преимуществами. Во-первых, он обладает свойством линейного 
окончания (для метода Шуберта это свойство не доказано). Во-вто- 
рых, он может быть применен, когда система (I, 1), (I, 6) не является 
разреженной, т. е. в случае, когда каждый блок схемы связан с боль- 
шим числом остальных блоков ХТС. Недостаток же по сравнению 
с методом Шуберта состоит в том, что, как мы указывали, примене- 
ние этого метода может столкнуться с трудностями, если в отдель- 
ных блоках т последовательны^ векторов з\ к) станут близкими 
к линейно зависимым, 
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Применение методов решения систем 
нелинейных уравнений 

Обычно необходимо рассчитать стационарный режим при различных 
значениях управляющих переменных и. Различают два режима рас- 
чета системы (II, 6) при изменении переменных и. В первом случае 
расчет системы (II, 6) проводится для небольшого числа значительно 
отличающихся одно от другого значений управлений и. Во втором 
случае проводится многократное решение системы (II, 6) для мно- 
гих значений вектора и, мало отличающихся одно от другого Ти- 
пичныи пример такого случая — это решение задачи оптимизации 
л некогда переменные и меняются в соответствии с некоторой стра- 
тегией поиска, и при каждом значении и приходится решать урав- 
нения (II, 6), описывающие стационарный режим схемы. Ко второму 
случаю сведется также решение систем нелинейных уравнений 
методом продолжения по параметру, а также решение систем нели- 
нейных уравнений на каждом шаге интегрирования при решении 
систем обыкновенных дифференциальных уравнений каким-либо 
неявным методом. Рассмотрим отдельно эти случаи, поскольку учет 
их специфики может существенно повысить эффективность поо- 
; цедуры расчета системы (II, 6). * 

Первый случай. Рассмотрим первый режим решения системы (II, 6). 
В этом случае, как правило, имеется плохое начальное приближе- 
ние к решению системы (II, 6). В то же время для хорошей работы 
квазиньютоновских методов необходимо выполнение следующих 
I условии: ч •’ 

1. Матрица Н 0 (или В 0 ) должна быть близка к обратной матрице 
! Якоби (прямой матрице Якоби). 

2. Система (II, 6) должна быть близка к линейной; это условие 
будет выполняться, если начальное приближение находится доста- 

I точно близко от решения системы (II, 6). Действительно, при этих 
условиях шаг в соответствии с (II, 14), (II, 23) будет почти ньюто- 
новским, примененным к системе, близкой к линейной, а, как мы 
видим, метод Ньютона дает решение системы линейных уравнений 
I за один шаг. При невыполнении этих условий трудно ожидать хоро- 
: шеи сходимости метода. А поскольку при плохом начальном приб- 
| лижении второе условие часто не выполняется, то и метод в этих 
I сл У 1 2 * ч а ях сходится не очень быстро. И, действительно, типичная 
I картина зависимости нормы правых частей системы от номера ите- 
рации проиллюстрирована на рис. 9. Вначале достаточно долго 
наблюдается очень медленная сходимость, и только в конце итера- 
, ционного процесса норма начинает очень быстро уменьшаться, т. е. 

: сверхлинейная сходимость появляется только в конце итера'цион- 
: ного процесса, когда выполняются оба условия, матрица Н ь стано- 
I вится близкой обратной матрице Якоби, а система (II, 6) вследствие 
близости итерационной точки к точке решения становится близкой 
к линейной. 

Итак, квазиньютоновские методы, как правило, имеют невы- 
сокую скорость сходимости, если в качестве начального приближе- 
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,ния используется плохая аппроксимация матрицы Якоби. Поэтому 
чаще всего в начальной точке определяется разностная аппрокси- 
мация матрицы Якоби, для получения которой требуется я + 1 
вычисление левых частей системы (И, 6). В связи с этим, если ме- 
тоды простой итерации ЭЕМ, СЮЕМ сходятся меньше, чем за я 
итераций, переходить к квазиньютоновским методам невыгодно. 
С другой стороны, интересно рассмотреть возможность и целесооб- 
разность совместной работы различных методов. При этом, конечно, 
соединение методов не должно быть чисто механическим, но при их 
соединении информация, накопленная в результате работы одного 
метода, должна использоваться в другом методе. 

В виде примера рассмотрим последовательное применение метода 
простой итерации и квазиньютоновского метода. Поскольку вначале 
квазиньютоновский метод часто дает плохую сходимость, в случае, 
когда метод простой итерации обеспечивает сходимость, может 
оказаться выгодным вначале на первых я шагах, использовать метод 
простой итерации, но на каждом шаге векторы х { и /у использовать 
для преобразования матрицы Я* (или В ь ) в соответствии с той или 
иной формулой квазиньютоновского метода, например, по форму- 
лам (II, 107), (II, 108). При і = я надо переходить на квазиньюто- 
новский метод, причем в качестве начального приближения к мат- 
рице # 0 (или В 0 ) использовать полученную к этому шагу матрицу Я г . 
Аналогично может оказаться выгодным применять метод БЕМ 
вначале, а затем переходить на квазиньютоновский метод. 

Метод Вольфа часто обеспечивает быструю скорость сходимости 
вначале и медленную в конце. В этом случае также может оказаться 
полезным сначала применять метод Вольфа, а потом переходить 
на квазиньютоновский метод. Причем поскольку на і-том ( і > я) 
шаге в методе Вольфа [3, с. 35 ] имеются я предыдущих значений /у, 
х і> (/ = і — 1, і — 2, ..., I — я + 1), эти значения могут быть 
использованы в системе уравнений (II, 32) для определения началь- 
ного приближения #о, с которого начнет работать квазиньютонов- 
ский метод. В этом случае при переходе от метода Вольфа к квази- 
ньютоновскому методу не понадобится дополнительных вычислений 
для построения начального приближения Я 0 . 

Второй случай. Рассмотрим теперь второй режим. Пусть при- 
ходится находить решение системы (II, 6) для последовательных 
векторов и, ( і = 1,2, ...). Будем исходить из предположения о том, 
что векторы и, изменяются на небольшую величину, т. е. выпол- 
няется соотношение 

||щ+1 — «НК 8 ( = 1,2,... (11,196) 

где е — малая величина. При определенных условиях (будем счи- 
тать, что эти условия выполняются) система (II, 6) определяет 
переменные х как неявные непрерывные функции переменных и. 
Обозначим через х* = х* (щ) решение системы (II, 6) при и == щ. 
Пусть с помощью одного из квазиньютоновских методов найдено 
решение системы (II, 6) при и = и*. Будем считать, что аппрокси- 
мировалась сама матрица Якоби; обозначим через В* предельное 
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значение матрицы аппроксимирующей матрицу Якоби. Можно 
предположить, что матрица В* достаточно близка к матрице 1 ; . 
Пусть теперь требуется найти решение системы (II, 6) при и — и і+1 

/(*,«<+ 1)=0 (11,197) 

где и і+1 удовлетворяет соотношению (11,196). Из соотношения 
(11,196) и непрерывности функций х* (и) вытекает, что х*+\ будет 
достаточно близко к х* т. е. 

|| *?+,-*; || < б (11,198) 

где 6 — малая величина. Отсюда, при решении системы (II, 197) 
в качестве начальных значений для переменных х целесообразно 
применять значение х*, полученное на предыдущей итерации 

*о = *; (11,199) 

Это обеспечит хорошее начальное приближение для переменных х. 
Отсюда мы можем надеяться на быструю сходимость квазиньюто- 
новского метода. 

Остановимся теперь на выборе начального приближения для 
матрицы В при решении системы (II, 197). При выполнении условий 
(II, 196), (II, 199) и при условии, что кривизна функции / невелика, 
можно предположить, что матрица В*, полученная на предыдущем 
шаге, будет хорошим приближением к / г+1 , поэтому в качестве В 0 
при решении системы (II, 197) может оказаться целесообразным 
взять матрицу В}. По сравнению с разностной аппроксимацией 
матрицы Якоби в начальной точке этот прием избавляет нас от 
дополнительных п расчетов левых частей системы (II, 197) в началь- 
ной точке. Хорошее начальное приближение может позволить от- 
казаться от требования, чтобы на каждом направлении при решении 
системы (II, 197) происходило уменьшение нормы левых частей 
системы (II, 197), т. е. отказаться от выбора а в выражении (II, 14) 
из условия (II, 18). или (II, 19), что было вызвано желанием обеспе- 
чить стабильность поиска даже при плохом начальном приближении. 
В данном случае а будет полагаться равным единице как и в нью- 
тоновском методе. 

В заключение следует отметить, что квазиньютоновский метод 
позволяет лучше использовать информацию, полученную на преды- 
дущем шаге, чем методы ОЕМ, (ЮЕМ и Вольфа. Действительно, 
в последних трех методах могут использовать только значения пе- 
ременных х, полученные на предыдущем шаге [см. выражения (II, 
199)], в то время как квазиньютоновский метод использует инфор- 
мацию и о матрице Якоби, полученную на предыдущем шаге. 
Поэтому в данном случае он может оказаться предпочтительнее 
упомянутых методов. 

Рассмотрим теперь применение метода Ньютона. В этом случае 
можно улучшить начальное приближение (II, 199), взяв его в виде: 

х о = Х І + (Иі +1 - Щ) (1 1 , 200) 

где производные дх*/ди определяются из (II, 6) по правилу дифферен- 
цирования неявных функций. 
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Расчет процесса синтеза аммиака * 

Синтез аммиака из азотоводородной смеси 

N 2 + ЗН 2 =?=* 2МН 3 + О 

является основным источником связанного азота для химической 
промышленности и производства минеральных удобрений. 

В настоящее время синтез аммиака проводят в крупных агре- 
гатах мощностью 1000 — -3000 т ІЧН 3 в сутки. Агрегат состоит из от- 
деления подготовки синтез-газа (азотоводородная смесь) при дав- 
лении до 30- ІО 8 Па и собственно отделения синтеза аммиака, прово- 
димого под давлением (200— 300)- 10 е Па. 

Рассмотрим технологическую схему отделения синтеза аммиака 
(рис. 11). Циркуляционный газ Г х , содержащий а х долей аммиака 
и инертов (аргон и метан) поступает в колонну синтеза 1. На 
выходе из нее газ Г 2 содержит а 2 долей аммиака. Производительность 
колонны синтеза 

Пкс = Г 2 а 2 — ГхЩ 

определяется объемом катализатора О к в колонне. 

Образующийся аммиак отделяется в конденсаторах 2 и 6 при 
температурах і к1 и і к2 соответственно и выводится из технологи- 
ческого цикла. Инерты частично растворяются в жидком аммиаке, 
частично выводятся из технологического цикла в составе продувоч- 
ных газов Г пр , доля отбора которых 

а = Гцр/Гцг (Гц г — поток циркулирующего газа). 

является важным режимным параметром технологической схемы. 
Свежая азотоводородная смесь Г св подается в испаритель 7 вторич- 
ного конденсатора 6. Жидкий аммиак Жі и Ж 2 из аппаратов 2 и 6 и 
амиак Жз из конденсатора продувочных газов 10 поступает в сборник 
(танк) 13. При этомдавление сбрасывается до 20- ІО 6 Па и десорбиро- 
ванные танковые газы, содержащие большой процент аммиака, 

поступают в конденсатор тан- 
ковых газов 14. Конденсат Ж х 
возвращается в сборник 13. 
Производительность схемы в 

Рис. II. Схема отделения синтеза ам- 
миака: 

1 — колонна синтеза; 2 — воздушный 
конденсатор; 3 — сепаратор; 4 — аммиач- 
но-холодйльная установка; 5 — узел от- 
бора продувочных газов; 6 — конденса- 
ционная колонна; 7 — испаритель; 8 — 
аммиачно-холодильная установка; 9 — 
циркуляционный компрессор; 10 — кон- 
денсатор продувочных газов; 11 — испа- 
ритель аммиака; 12 — аммиачно-холо- 
дильная установка вымораживания тан- 
ковых и продувочных газов; 13 — сбор- 
ник жидкого аммиака; 14 — конденса- 
тор. 


* Раздел написан совместно 
с Д. Н. Мотылем. 
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ж, 



Рис. 12. Информационная схема отделения синтеза аммиака: 

— * — технологический поток; -> — информационный поток режимно-конструк- 
тивных параметров аппаратов; -> — обратные связи, соответствующие проектным 

условиям; ‘ 

I — VIII — расчетные модули (в скобках указаны позиции соответствующих аппаратов, 
изображенных на рис. 11); IX — проектное условие П с = сопзі; X — то же, Г 1 = сопзі! 

целом П с определяется количеством товарного аммиака, выходя- 
щего из танка 13. 

Для моделирования технологической схемы на ЭВМ нужно 
перейти к ее формализованному математическому описанию. В случае 
модульного подхода к расчету таким описанием будет расчетная 
блок-схема и ориентированный граф (рис. 12). Узлы графа представ- 
ляют модули расчета математических моделей аппаратов, дуги — 
направления передачи информации от модуля к модулю. 

В модуле / расчета колонны синтеза использована модель идеали- 
зированного реактора, предложенная Ю. А. Соколинским [51 ]. 
При этом рассчитывается максимальная производительность реак- 
тора, которая теоретически может быть достигнута при данном дав- 
лении и составе входящего в колонну газа. 

Расчет конденсации аммиака в модулях II, V, VIII требует 
определения равновесного содержания аммиака а * в многокомпо- 
нентной газовой системе: азот — водород — метан — аргон над жидким 
аммиаком. По правилу аддитивности 

а * = Ц а / (Р, Т) с / 

і 

где а* — равновесное содержание аммиака в системе; с, — содер- 
жание /-го компонента в газовой смеси без аммиака, пересчитывае- 
мое из содержания /-го компонента с ; в системе по формуле 

ё/ = с//(1 — а*) 

в которой а* ( Р , Т) — равновесное содержание аммиака при дав- 
лении Р и температуре Т в бинарной системе аммиак — /'-тый компо- 
нент, рассчитываемое по уравнению Ларсона — Блэка [52]: 

а;(Я,Т) = е*р(^ + ^ + ^) 
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Концентрации компонентов в газовой фазе с,- связаны с их раствори- 
мостями в жидком аммиаке правилом Генри: 

ѵі= в Рс,Н (Т) 

где ѵ } — количество /-го компонента, растворенного в жидком амми- 
аке § при давлении Р\ Н ( Т ) — константа Генри, представленная 
полиномом второй степени от температуры конденсации Т. 

Количество конденсата аммиака § определяется уравнением 
материального баланса: 

ГвхОвх = г ВЫХ а ВЫХ “Н § 

где Г* расходы; а; концентрации аммиака на входе и выходе 
из аппарата, причем а ВЬІХ = а*. 

При низком давлении в конденсаторе 14 (см. рис. 11) равновесная 
концентрация аммиака в газовой фазе рассчитывается по закону 
Дальтона: а* — Р нпИНз (Т)/Р , где Я нпМНз — давление насыщенных паров 
аммиака. Структурный анализ системы уравнений баланса конденса- 
тора аммиака показал, что ее решение может быть сведено к ите- 
рациям по одной переменной, например, количеству р конденсата 
аммиака. ' 

Расчет узла смешения VI (см. рис. 12) свежего газа с цирку- 
ляционным в производстве жидкого аммиака и сборника VII не- 
сколько^более сложен, чем расчет конденсаторов, он включает в себя 
тепловой баланс смешения потоков, обладающих различным тепло- 
содержанием, при этом происходит испарение или конденсация части 
жидкого аммиака в зависимости от конкретных условий. 

В силу важности производства аммиака его расчету и оптимиза- 
ции посвящено большое число работ например [53]. Здесь описан 
расчет отделения синтеза аммиака с помощью автоматизированной 
системы технологических расчетов (АСТР) [54]. Система АСТР 
построена по иерархическому принципу и имеет три уровня. На верх- 
нем уровне используются проблемно-ориентированные языки со 
средствами структурного анализа для автоматического определения 
порядка расчета: язык СХТС модульного подхода к расчету схемы 
И язык СОЛВЕК, ориентированный на уравнения [48]; на среднем 
уровне ПЛ/1-АСТР — язык ПЛ/1, расширенный специальными 
синтаксическими и вычислительными средствами ускорения сходи- 
мости, оптимизации режимно-конструктивных параметров, печати 
таблиц материально-тепловых балансов для проектных документов 
ит. д.; на нижнем уровне — комплексы программ конкретных тех- 
нологических расчетов, к которым проектировщик обращается 
с помощью стандартных бланков. Один из таких комплексов — 
СИНТАМ [54 ] служит для многовариантных расчетов отделения 
синтеза аммиака. 

Схема отделения синтеза аммиака имеет два технологических 
цикла (см. рис. 12): цикл синтеза, состоящий из колонны синтеза /, 
первичного конденсатора I 1, линии продувки III, вторичного кон- 
денсатора^ V со вводом свежего газа VI, и рецикл танковых газов, 
состоящий из танка VII и конденсатора танковых газов VIII. 
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В случае проведения проектных расчетов к уравнениям баланса 
по циклам добавляются уравнения проектных условий, например 
такие: подобрать долю отгона, продувочных газов а так, чтобы рас- 
ход циркуляционного газа Г х соответствовал производительности 
циркуляционного компрессора, или такие: подобрать объем (X 
катализатора в колонне синтеза, обеспечивающий требуемую про- 
изводительность схемы при прочих заданных условиях (см. рис. 12). 

!тгЫ?п МаЦИ0ННЫе об Р атные связи проектных условий дополняют 
информационные связи между аппаратами, осуществляемые техно- 
логическими потоками; на расчетной схеме (рис. 12) они обозначены 
штрих-пунктирными линиями. Исходя из технологических сооб- 
ражении в данной схеме можно выделить 1 1 характеристических 
величин, т. е. существенных параметров, наиболее часто варьируе- 
мых в проектных расчетах. Их можно разбить на два класса. 

I. Пять исходных величин (входных переменных схемы) при 
поверочном (или простом моделирующем) расчете схемы: Г гв — рас- 
ход свежего газа; а — доля отбора продувочных газов; О к — объем 
денсации™^ 3 ’ ^ к1 ’ ^ ~ темпе Р ат УРы первичной и вторичной кон- 

II. Шесть результирующих величин поверочного расчета схемы: 

0 ’ кс производительность схемы и колонны синтеза* йл а 

содержание аммиака на входе и выходе из колонны синтеза-’ Г, 2 — 
расход циркуляционного газа; и г — содержание инертов (аргон 
и метан) в циркуляционном газе. ѵ в 

Виды проектных расчетов одной схемы различаются тем, какие 
из перечисленных характеристических величин задаются технологом 
очно ’ а какие — определяются в ходе итерационного расчета. Та- 
о 30М ’ общее число ВИДОВ расчетов достигает числа 11!/5'6' = 
~ 4ЬЛ Возможности блока сходимости ПЛ/1-АСТР обеспечивают 
объединение всех вариантов расчета в одной программе. * 

ѵ ® Г? ВН0М варианте СИНТАМ реализован модульный много- 
? и П0дход к Р асчет У схем. Первому (внутреннему) уровню 
итерации сходимости соответствует расчет отдельных аппаратов 
(в каждом аппарате итерации проводятся не более, чем по двум 
переменным); второму — расчет рецикла танковых газов по пяти 
переменным разрываемого потока Ж 4 (расход и концентрациям); 
третьему - баланс цикла синтеза по потоку Г, (пять переменных) 
и решение уравнении проектных условий (их максимальное число 
соответствует числу характеристических переменных схемы, относя- 
щихся к классу I). Кроме того, использовался модульный двухуров- 
П0ДХ0Д ’ при К0Т0 Р 0М итерации по рециклу танковых газов 
(Ж 4 ) были вынесены на верхний уровень, и подход, ориентированный 
уравнения. В последнем случае был проведен структурный анализ 
всей системы из 166 уравнений материально-теплового баланса 
отделения синтеза аммиака. Для поверочного расчета общая система 
разбивается на три блока совместно решаемых уравнений, соответ- 
ственно, с девятью, двумя и четырьмя итерируемыми переменными. 
При этом сокращается как число итерируемых переменных (15 
против 18 при модульном подходе), так и число итераций сходимости 
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Таблица 7. Сравнение методов решения систем 
нелинейных уравнений 


Метод 


Способ 
выбора 
шага * 


Трехуровневый расчет 
(по 5 итерируемым 
переменным на двух 
верхних уровнях) 


Двухуровневый расчет 
(10 итерируемых 
переменных на 
верхнем уровне) 


число 

направлений 


число 
обращений 
к модели 


число 

направлений 


число 
обращений 
к модели 


от і 
от і 
от 2 
от 2 

Вгоуйеп 1 
Вгоусіеп 1 
Вгоусіеп 2 
Вгоусіеп 2 


1 

2 

1 

2 

1 

2 

1 

2 


\ѴОЬР 


2 

20 

2 

• 12 

1 

25 

2 

17 

13 

77 

43 

149 

16 

307 

>50 

>400 

2 

20 

2 

12 

1 

25 

2 

17 

24 

163 

>50 

>400 

9 

166 

>50 

>400 

3 

20 

4 

13 


* 1 уменьшение нормы вектора невязок; 2 — минимизация нормы 
по направлению. 


вектора невязок 


(нет вложенных итераций). Время счета уменьшается в среднем 
в 1,5 — 2 раза. 

Введение проектных условий может по-разному влиять на трудо- 
емкость расчета при модульном и ориентированном на уравнения под- 
ходах. В первом случае с каждым проектным условием добавляется 
новое уравнение, увеличивающее размерность решаемой задачи, 
во втором эффект может быть противоположным. Так, если заданы 
производительность схемы П с и расход циркуляционного газа Г х , 
общее число итерируемых переменных после структурного анализа 
сокращается с 15 до 12. 

Для решения систем нелинейных уравнений материально-теп- 
лового баланса и проектных условий применялись квазиньютонов- 
ские методы С}ЫМ1, <ЗЫМ2 (см. с. 47), методы Бройдена Вгоусіеп 1 
Вгоусіеп 2 (см. с. 47) и метод Вольфа (\ѴОЬР) [3, с. 35], в который 
были введены эвристики, касающиеся процедуры построения и из- 
менения симплекса точек, подобранные в ходе многочисленных 
технологических расчетов различных схем [54]. 

В табл. 7 приведены результаты сравнения различных методов 
решения систем уравнений и вариантов модульного подхода к рас- 
чету отделения синтеза аммиака. Сравнивались трехуровневый и 
двухуровневый подходы. В первом случае итерации производились 
по пяти переменным на верхнем и по пяти переменным на среднем 
уровне (итерации в итерации). Во втором случае итерации проводи- 
лись по всем десяти переменным совместно. В обоих случаях итерации 
на уровне расчета отдельных аппаратов не учитывались. Методы 
сравнивались по числу направлений одномерного поиска и числу 
обращений к модели — расчету аппаратов схемы. В случае, когда 
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число обращений к модели превышало 400, а число направлений — 
50 испытание метода прекращалось. 

Результаты показывают преимущество совместного решения си- 
стем уравнений перед методом вложенных итераций. Незначительный 
рост числа направлений поиска на верхнем уровне компенсируется 
значительным сокращением числа обращений к модели. Методы с на- 
чальным вычислением обратного Якобиана (РЫМ1 и Вгоубеп 1) 
дают лучшие результаты по сравнению с заданием в качестве на_- 
чального приближения единичной матрицы (РЫМ2, Вгоуйеп 2). 
Эти последние методы хуже определяют направление поиска корня 
и, кроме того, оказываются чувствительными к порядку написания 
уравнений. Использование в одномерном поиске минимизации нормы 
вектора невязок приводит к увеличению числа обращений к модели, 
что проявляется особенно заметно, когда направление поиска задано 
неточно ((ЗКМ2, Вгоубеп 2). Метод Вольфа дает в среднем хорошие 
результаты, хотя это можно отнести за счет заложенных в него эври- 
стик. В целом, можно рекомендовать квазиньютоновские методы с на- 
чальным вычислением обратного Якобиана и с уменьшением нормы 
вектора невязок без минимизации по направлению поиска. 


ГЛАВА III 

Методы безусловной 
оптимизации 

Общая характеристика задач оптимизации 
процессов 


| Рассмотрим алгоритмы оптимизации ХТС, не учитывающие ограни- 
I чения на варьируемые параметры. Конечно, в любой практической 
| задаче существуют ограничения на эти параметры. Однако на мето- 
| дах безусловной минимизации имеет смысл остановиться по следу- 
} ющим причинам: 

‘ а. В задачах оптимизации ХТС ограничения на варьируемые 
параметры часто имеют простой вид (I, 9). С помощью простой за- 
мены переменных задачи с ограничениями этого типа сводятся к за- 
; дачам без ограничений [55]. 

; б. Методы безусловной минимизации обобщаются (см. гл. IV) 
на случай учета более сложных линейных ограничений. 

в. Решение задач минимизации общего вида часто сводят к по- 
следовательности задач безусловной минимизации специальным 
образом сконструированных функций (см. гл. IV). Таким образом, 
наличие эффективных алгоритмов решения задач без ограничений 

79 


дает основу для решения разнообразных задач оптимизации ХТС 
при наличии ограничений. 

В главе I было показано, что задача оптимизации ХТС эквива- 
лентна задаче оптимизации некоторой функции 

тіп / (л:) (III, 1) 

Остановимся на ряде особенностей вычисления целевой функции 
Г (х) в задачах оптимизации ХТС. 

Расчет функции / (х) сводится к расчету статического режима 
Х1С при фиксированных значениях варьируемых параметров. 

2. Наличие в схеме аппаратов с распределенными параметрами 
(каталитические реакторы с неподвижным или «кипящим» слоем 
катализатора) приводит к необходимости интегрирования систем 
обыкновенных дифференциальных уравнений при расчете таких 
аппаратов. 

3. В ХТС часто имеются аппараты (реакторы с мешалками, 
ректификационные колонны, экстракторы и др.), расчет которых сво- 
дится к выполнению трудоемких итерационных процедур. 

4. Наличие в схеме рециклов и тепловых обратных связей при- 

водит к тому, что при сведении материального и теплового балансов 
возникает необходимость в итерационной процедуре на уровне 
расчета ХТС (см. гл. II). ^ 

5. Схема может характеризоваться несколькими сотнями фазо- 
вых и несколькими десятками управляющих переменных. 

Таким образом, задача оптимизации ХТС чрезвычайно сложна 
имеет большую размерность, требует огромного числа операций даже 
для одного расчета значения целевой функции. Следовательно, 
чтобы решение реальных задач оптимизации ХТС могло быть вы- 
полнено в приемлемые сроки необходимо использовать самые эффек- 
тивные методы оптимизации. 

Рассмотрим методы сопряженных направлений и квазиньютонов- 
ские методы. В обоих случаях вначале будем рассматривать методы 
минимизации квадратичных функций, на основе которых будут кон- 
струироваться методы минимизации произвольных функций. 


Свойства и методы сопряженных направлений 
Свойства сопряженных направлений 


Пусть требуется найти минимум квадратичной функции 
/ (х) = 0,5 (х, Ах) + (Ь, х) + с 


(III. 2) 


^’іч* /Т Ьп ' > ' с = ( с і> •••" °п) — матрицы-столбцы (векторы) 

размерности (я X 1) ( Ь , с — постоянные); А = (а и ) — (п X я)-матрица. Будем 
исходить из предположения, что матрица А: у 

1. Симметрична 

А Т т А (III 31 

2. Положительно-определенна ' ’ 


(х, Ах) $ т Ах > 0 для х 0 
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(III, 4) 


Пусть для поиска минимума используется один из методов спуска, при котором 
последовательные приближения подсчитываются с помощью формулы (I, 39). Для 
определения направления р { на і - той итерации имеется какой-то алгоритм. Коэф- 
фициенты ос; на (-той итерации в общем случае выбираются из условия (I, 46) в ча- 
стном случае когда ищется минимум на каждом направлении, в точках х к , (к = 
— 1, .... п — 1) выполняются соотношения: 

(Рі,8і+і) = О (ІІІ.5) 


Градиент ^ функции / в (-той точке будет равен [11, с. 263] 
ёі = 8 ( Х І ) = егаб / (х) \ х=х _ = Ахі+Ь 

ТТАШГ П^АОиаишто 


(Ш, 6) 


Введем обозначение 1 

Уі=8і+і — 8і (III, 7) 

Будем исходить из предположения, что а ; ф 0. Используя равенство (III, 6), по- 

Уі = А (х і+1 — хі) = А$і (III, 8) 

С учетом выражения (1,40) имеем 

Уі=щАрі (III, 9) 

Тогда формула (III, 7) позволяет получить 

Ш+і = 8і + °чАрі (111,10) 

Определение. Ненулевые векторы (направления) 

Р°- Рі, . . ., р п _г (III, 11) 

будем называть Л -сопряженными или просто сопряженными, если выполняются 
равенства: 

(Рі, Лр;)=0 /^о, 1, ...,(- 1 1 = 2 к к^п- 1 

(III, 12) 

(Рі, Ар/) — • 0, 1 = 0, 1 1—1 1=2,..., к к^п— 1 

(III, 13) 

Поскольку матрица А положительно-определенна, в соответствии с условием (III 4Ѵ 
получим ■’ ' ’ > 

(Рі, Арі)> 0 (III, 14) 

Равенства (III, 12) (III. 14) будем называть соотношениями сопряженности. Под- 
§, аВ пТт ( П ’ 12) “ (ІІІ > 14 ) выражения Ар у = У] / а } и Рі = из фор- 
мул (111, 9), (1, 40), получим другую форму соотношений сопряженности 


(*л Уі ) 0 

(Н, У})--= 0 


/ = 0, 1 (- 


і -= 0, 1 ,...,/ 


(*і, Уі) > о ( з= 0, 1 , . . . , к (111,17) 

Введем клеточные п X 1 -матрицы К; и 

Ѵі = (Уо, Уі.і) =- (5 0 , .... 5*_!) (<П (111,18) 

Используя правила умножения клеточных матриц, соотношения сопряженности 
щп, іо), Щ1, 1Ь) можно записать следующим образом: 


(к^п— 1) 

(III, 15) 
(к ^ п — 1) 

(III, 16) 
(III, 17) 

I п (III, 18) 


У'х. =° #=1 к к^п (111,19) 

5 /Р/ = 0 у = 1 (111,20) 

Можно показать, что сопряженные векторы (III, 11) являются лннейно-независи- 

МЫМИ | 1 1 ^ . 


(= 1 к 
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Конечность числа направлений поиска. Докажем вначале, что в точках смены 
направлении ху выполняются соотношения смены 

(Рі> 8к) = (Рі, §і+ і) /г>/+! (III, 21) 

Прежде всего ясно, что для к = / + 1 соотношение (111,21) верно; докажем что это 
справедливо и для к > / + 1. Из соотношения (III, 7) для і = / -)- 1, ...,к получим 

к - 1 

8к~8і+і ~Ь 2 У‘ (III 221 

«=/+і ѵ ’ ’ 

Умножим скалярно уравнение (III 22) на р, (/ + 1 < к), тогда согласно свойству 
(іи, ш) сопряженных направлении получим соотношение (III 21) 

ДП, С 6) М л Я е Я гко н 0 ай Т дем ШеНИе (ІП,21) " РИ * = " ВеЛИЧИНЫ из Р авенства 

(Рі, Ах п ) ----= (р/, Ах иі ) (111,23) 

Пусть теперь построены п сопряженных направлений Ро ,..., р п _ х и найдена точка 
на П0Сле Днем направлении. Поскольку векторы р 0 ,...,р п1 являются линейно- 
независимыми, они образуют базис в п-мерном пространстве [56 с 721- отсюда 
координаты любой точки х этого пространства могут быть представлены’ в виде: 

х = х п + РоРо + • • • + Рп-1рн_1 (111,24) 

где Рг — некоторые коэффициенты. Определим теперь коэффициенты В; таким обра- 
Г™ Т ^’пТГ а * ок . а І З ал ась минимумом функции Для этого координаты точки * 
[с учетом равенства (III, 6)] должны удовлетворять соотношению: 

§гас1/ = Лх+6 = 0 (111,25) 

Подставим теперь в выражение (111,25) величину * из (III, 24) и умножим скалярно 
это соотношение на вектор ру; тогда, принимая во внимание свойства (III 12) (III 13) 
сопряженных направлений и используя равенство (III, 23), получим 

(Рі, Ах,- +1 ) + Ру (рі, Арі) + (ру, Ь) = О (III, 26) 

Подставляя в (111,26) величину 


Ах 


: /+і -■ 8і + 1 — Ь 


(III, 27) 


и используя соотношение (III, 9), легко получим 

Ру = — 1 «7 (рі. еиі)Кри уі) (іп, 28) 

В частном случае, когда точки ху являются оптимальными на каждом направлении 

тпи^Т ТС ГГ в С соотн °шением (III, 5) все ру = 0 (/ = 0Г^="1) и, следовательно,’ 
точка х п является минимумом функции /, т. е. в ней выполняется соотношение 

8п»0 (111,29) 

Итак, минимум функции / будет определен за п шагов, если поисковые направления 
будут сопряженными и на каждом направлении будет определяться оптимальная 
точка. пели точки смены направлений не будут оптимальными, то потребуется сде- 
лать п Д- 1 шаг. ' 3 

Определение минимума в линейном многообразии. Пусть л 0 , .. р ■ сопря- 
женные направления. Образуем линейное многообразие М (х а> р' п , рЛ прохо- 
дящее через точку х 0 и параллельное векторам р 0 , Рі , Точки х этого многообра- 
зия удовлетворяют соотношениям 

х = *о + ѴоРо + • • • + УіРі (111,30) 

г Д е Уі, {I = 0, і) произвольные числа. Тогда точка д; г - +1 = х; -4- а іРі (где х,-,і 

оптимальная точка на направлении Рі ) является минимумом в многообразии М (х„ 
Ро, РО- Действительно, в силу равенства (III, 21) с учетом соотношения (III 51) 

(Рі, ш+і)ш О / == о, 1, .... і (III, 31) 

Из теоремы, приведенной в работе [11, с. 268], следует доказательство сформули- 
рованного утверждения, т н . 
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Построение алгоритмов минимизации. Формы записи соотношений сопряжен- 
ности (III, 12) — (III, 14) и (III, 15) — (III, 17) совершенно эквивалентны, тем не менее 
последняя из них имеет то преимущество, что в ней в явном виде не используется 
матрица А. Это дает возможность строить алгоритмы, в которых не используются 
коэффициенты матрицы А. 

Рассмотрим вначале алгоритмы минимизации квадратичных функций, обеспе- 
чивающих выполнение соотношений (III, 15) — (III, 17), у которых на каждом на- 
правлении ищется оптимальная точка. В случае симметричности матрицы А вы- 
полняется соотношение [11, с. 262] 

(Рі, АРі) = (Р/, Арі) і < і (III, 32) 

Используя выражения (III, 9), (III, 32), получим 

(Рі, У/) = а/ (Р/, Арі}М(Рі, У і) (а//а,-) / < і (111,33) 

Выполнение соотношения (III, 15) гарантирует выполнение соотношения (III, 16). 
Это свойство важно для практического построения алгоритмов минимизации, по- 
скольку последние можно строить таким образом, чтобы они обеспечивали только 
выполнение соотношения (III, 15). 

Перейдем теперь к задаче минимизации неквадратичных функций. Направле- 
ния, удовлетворяющие условиям (III, 15), будем называть сопряженными -[57, 
с. 123]. Ясно, что в общем случае из соотношений (III, 15) не следуют соотношения 
(III, 16), как в случае квадратичных функций. Поэтому направления, удовлетворя- 
ющие условиям (111,15), не будут обладать свойствами, которыми они обладали бы 
в случае квадратичности функций, в частности, свойством окончания поиска за 
п шагов. Тем не менее, алгоритмы, основанные на построении направлений, удо- 
влетворяющих условиям (111,15), оказались эффективными и при минимизации 
неквадратичных функций. Объясняется это, по-видимому, тем, что в окрестности 
минимума достаточно гладкая функция должна хорошо аппроксимироваться ква- 
дратичной функцией; отсюда алгоритмы, использующие сопряженные направле- 
ния, должны давать быструю сходимость в окрестности минимума. Заметим, что 
как раз в окрестности минимума градиентные методы существенно замедляют ско- 
рость поиска. 

Пусть для произвольной функции построены п направлений Ро, , Рп~і> 
удовлетворяющих условиям (III, 15). Поскольку для произвольной функции опти- 
мальная точка на п - м направлении, вообще говоря, не будет совпадать с точкой 
минимума целевой функции, необходимо продолжить построение направлений р п , 
Ргщ, ••• удовлетворяющих условиям (III, 15). 

Рассмотрим построение вектора р п . В соответствии с условиями (III, 15) он 
должен быть ортогонален п векторам у 0 , ..., у п ..\- Поскольку в общем случае (если 
векторы у 0 , ..., у п _ г линейно-независимы) в п-мерном пространстве невозможно 
построить ненулевой вектор, ортогональный п векторам [56, с. 205], при постро- 
ении вектора р п можно пойти двумя путями. В первом случае можно 
отбросить условие (р п , у 0 ) = 0 и потребовать, чтобы выполнялись условия ( р п , 

Уі) = 0,7=1 ( п — 1). При построении вектора р п+1 в свою очередь будет 

отброшено условие (р п+ і, Уі) = 0, и т. д. Тогда на к-ы шаге (к ^ п) вектор ръ 
будет строиться таким образом, чтобы векторы р к , х Рк-п+і были сопря- 

женными, т. е. чтобы выполнялись соотношения: 

(Рк, Ук- 1)=0 (р к , Уь-г) = 0 ( Рк , Ук-п+і) = 0 (111,34) 

Во втором случае, начиная с вектора р п , можно заново предпринять 
нахождение векторов, удовлетворяющих соотношениям (111,15). Аналогичная си- 
туация возникнет через п шагов, когда опять надо будет начать новое построение 
направлений, удовлетворяющих соотношениям (111,15), и т. д. Таким образом, 
в данном случае при і = кп (где к — 1,2,...) надо будет каждый раз начинать 
заново строить направления, удовлетворяющие условиям (III, 15). 

Будем называть базисом в точке хк совокупность т векторов р к , рк_і-, ..., 

• Рк-т+і, Для которых обеспечивается сопряженность при применении того 
или иного способа построения сопряженных направлений. Число векторов т будем 
называть глубиной базиса. Таким образом, при первом способе построения векто- 
ров рі глубина базиса всегда постоянна и равна п. От точки х к к точке х к+1 базис 
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меняется непрерывно причем вектор р к _ т+1 из него удаляется, а вектор 
него добавляется. В связи с этим методы, в которых будет использоваться такой 
способ построения сопряженных направлений, будем называть методами построения 
сопряженных направлений с непрерывным изменением базиса. 

При втором способе построения сопряженных направлений происходит цикли- 
ческое изменение базиса. Глубина базиса в каждой точке цикла из п шагов увели- 
чивается на единицу, причем через каждые п шагов построение базиса начинается 
заново. В связи с этим такой способ построения сопряженных направлений будем 
называть методом построения сопряженных направлений с циклическим изменением 
оазиса. При использовании подобных методов в точках і = кп (к = 1,2,...) проис- 
ходит как бы обновление метода. Подобные алгоритмы называют также алгорит- 
мами с обновлением. Операция обновления может потребоваться и в других случаях, 
гіа этом мы остановимся лишь при описании конкретных алгоритмов. 

Методы сопряженных направлений * 

Рассмотрим методы сопряженных направлений с циклическим и непрерывным изме- 
нением базиса. 

Метод с циклическим изменением базиса. В соответствии с условиями (III 15) 
на і-том шаге (і < п) вектор должен быть ортогонален і векторам ц Л ... и- , 
т. е. п компонент вектора рі удовлетворяют і линейным соотношениям. Это значит' 
что соотношения (111,15) неоднозначно определяют вектор р ь и имеются (п — і) 
степеней свободы. В связи с этим можно потребовать, чтобы вектор Рі удовлетворял 
некоторым дополнительным условиям. Остановимся на одном способе построения р,- 
Шозначим через О линейное пространство, натянутое на векторы у 0 ^ ' 

тт ер ^ С еГ ° 0 Р тогональн ° е Дополнение (С 1 В, С X В = Е п ). Согласно’ условиям 
' 1а ) вектор рі должен лежать в пространстве С. Помимо этого потребуем чтобы 

направление Р; для і > 1 являлось проекцией - ёі на С [31 ]. В качестве р 0 возь- 
мем — Яо- Іакои выбор рі приведет к тому, что угол, между агітиградиентом и на- 
правлением, поиска будет наименьшим. Это будет способствовать устойчивости по 

иска. При таком построении г* = р { / 1| р ь * * 

убывания функции / (х) в пространстве С, т 

йг 


будет направлением наискорейшего 
е - г = г; будет давать решение задачи 


гес 


(III, 35) 


— шах 
ІИІ=1 

Поскольку производная йЦйг равна г* ё , задача (III, 35) нахождения п может быть 
сформулирована следующим образом: 

тіп г Т §і = 0 і<п— 1 (111,36) 

Уіг =0 


где 


Запишем функцию Лагранжа задачи (III, 36) 

Е = г\+и^г+Иг т г~ 1) 

іде и = (и 0 , ..., Р — множители Лагранжа. Приравняем нулю частные 

производные дидг и проделав несложные преобразования, получим [11] 

(ПІ, 37) 
(III, 38) 

Матрицу Рі называют проекционной, так как рі является проекцией *-Р; на С 
Из построения и формулы (III, 38) видно, что ё 

Ро = Іп> Рп — 0 

( Р іУі — 0 для / = 0, 1 1 — 1 

I РіЯ = Я Для таких д, что (д, у у) = 0 


Рі = —РіВі 

У] 


Раздел написан совместно с А. Р. Беляевой. 
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Покажем, что векторы у 0 , . Лі у { _ г линейно независимы и, следовательно, суще- 
ствует матрица, обратная У]Ѵ С . В самом деле, предположим, что у 0 , ли- 

нейно зависимы, тогда существует такая совокупность с/, (/ = 0, і — 1), с§ + 
+ ••• + Ф 0, что 

СоУа + с лУі + • • • + Сі_іуі_і = О (III, 39) 

Умножим соотношение (III, 39) скалярно на получим с; (у/, з } -) = 0. Поскольку 
(У}> */) >0 [см. выражение (III, 17)], С] = 0 для любого /. Полученное противо- 
речие доказывает линейную независимость г/ 0 , .... уі_ г . В работе [31] показано, 
что матрицу Р; можно строить с помощью следующего рекуррентного соотношения: 


Рі + 1 = Рі 


РіУіУІРі 

У Т і Р іУі 


Ро = Іп 


(III, 40) 


Транспонируя выражение для Р; +1 , легко показать, что, если матрица Рі сим- 
метрична, то матрица Р; +1 также будет симметричной. Но поскольку матрица 
Л) = Іп симметрична, все матрицы Р; также будут симметричны. Кроме того, можно 
показать, что матрица Р* положительно полуопределена. Другой путь построения 
сопряженных векторов р 0 , .... основан на использовании процесса ортогонализа- 
ции Грамма — Шмидта [56, с. 209], [И, с 45]. Рассмотрим теперь конкретные ал- 
горитмы минимизации функций, использующие описанные выше способы постро- 
ения сопряженных направлений. 

Алгоритм I РРМ. Оптимальная точка ищется на каждом направлении. Вну- 
три цикла поисковые направления строятся в соответствии с формулами (III, 37), 
(III, 40). При значениях-і = кп , (к = 1, 2, ...) полагается Р* = /„, следовательно, 
Рі = — ёі- 

Метод с непрерывным изменением базиса. В этом случае до і = п — 1 напра- 
вления поиска будут определяться решением задачи (III, 36), где матрица К; опре- 
деляется соотношением (111,18), а для і ^ п — решением той же задачи, но со сле- 
дующей матрицей Уі = (</;_„ +1 , ..., уі-і). 

В этом случае на каждом шаге имеется только одна степень свободы при определе- 
нии рі . Решение данной задачи в этом случае также может быть записано в виде 
формул (III, 37), (III, 38). 

Метод сопряженных градиентов [58]. Можно показать, что если оптимальная 
точка ищется на каждом направлении, то для квадратичных функций метод сопря- 
женных направлений (см. алгоритм I) эквивалентен методу [59, с. 80 — 81 ] , в ко- 
тором поисковые направления определяются следующим способом (см. также ра- 
боту [11, с. 47—49]): 

Рі = — ёі + ѴіРі-і' (111,41) 

Здесь уі определяются с помощью одной из следующих формул 

Уі = (ёі, ёі)/(ёі-і, 8і-і) 

, , , (III, 42) 

Уі = (Уі-ъ 8і)/(Уі- 1 . Рі- 1 ) 


Алгоритм II основан на методе с циклическим изменением базиса, в котором 
направления внутри цикла определяются с помощью формул (III, 41), (111,42); 
обычно его называют методом Флетчера — Ривса. 

Преимущество методов сопряженных градиентов по сравнению с методами 
сопряженных направлений состоит в том, что они требуют хранения только век- 
тора, в то время как методы сопряженных направлений требуют хранения п X «-ма- 
трицы. Это особенно важно при решении задач большой размерности. В то же время 
практический опыт показывает, что методы сопряженных направлений, как правило, 
обеспечивают большую скорость сходимости, чем методы сопряженных Градиентов. 
Этот факт, по-видимому, может быть объяснен только тем, что при применении ме- 
тодов сопряженных направлений обеспечивается сопряженность направлений при 
любых а,-. Метод же сопряженных градиентов этим - свойством не обладает, поскольку 
при выводе формул (III, 41) — (III, 42) существенно использовалось то, что ищется 
оптимальная точка на каждом направлении [11, с. 47 — 49]. 
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Минимизация специальных нелинейных функций [60]. Пусть нелинейная функ- 
ция имеет вид: 

Р = РІІ (*)] 

где Р (/) — монотонная функция одной переменной > 0); / ( х ) — положительно- 
определенная квадратичная форма. Используя правило дифференцирования слож- 
ных функций, легко получить соотношение 


ёгаО/ =* 



§ца(і Р 


(III, 42а) 


Приравняв 2га<1 / нулю, получим, что точка минимума функции Р совпадает с точ- 
кой минимума квадратичной функции / ( х ). Используя метод сопряженных гра- 
диентов (III, 41), (III, 42) для минимизации функции / (х), найдем ее минимум, а, сле- 
довательно, и минимум функции Р [/ (х)], за п шагов. Будем считать, что во время 
поиска мы можем получать значения только функции Р и ее градиента. В связи 
с этим преобразуем формулу. (III, 41) таким образом, чтобы в нее входили только 
упомянутые значения. Для этого подставим в формулу (III, 41) значение §габ / из 
соотношения (III, 42а): 


Рі 



§габ Рі 


(Р(- О 2 (егабЯь егаД /=•;•) 

(Р-) 2 (ёгаб Рі_ и В га(1 Рі_ г ) Р'- 1 


(III, 43) 


где через Р’ { обозначено значение Р ) в і-той точке. Вводим векторы р. = Р\рр по- 
скольку Рі и рі коллинеарны и ищется минимум на направлении, безразлично, 
какой из этих векторов использовать. Подставляя значение р; в выражение (III, 43), 
после простых преобразований получим 


Рі — — ёгаб Рі + р; 


II бгаб Рі || 2 
II бгаб Р і_! || 2 Р ’- 1 



Далее, предполагая тот или иной вид функции Р (/), можно строить различные кон- 
кретные формулы. Так, в работах [60; 61] предлагаются формулы, основанные на 
представлении Р в виде Р = е х / (х) +■ 0,5е 2 / 2 (х), і 7 = е х [ехр (/ ( х ) — 1)]. Коэф- 
фициенты е 1 , е 2 неизвестны и подбираются на основе данных, получаемых во время 
итераций. Для ряда тестовых функций показано превосходство этого подхода перед 
обычным методом сопряженных градиентов [60; 61]. 


К вазиньютоновские методы оптимизации 

Метод Ньютона, обеспечивающий минимизацию произвольных функ- 
ций, описан в работе [11, с. 268]. Основным недостатком этого 
метода является необходимость на каждом шаге вычислять матрицу 
вторых производных (гессиан) функции / ( х ). Это обстоятельство 
явилось побудительной причиной развития квазиньютоновских ме- 
тодов, в которых на основе информации о значениях функции и ее 
производных в точках поиска строится некоторая аппроксимация 
либо самого гессиана В г , либо обратного гессиана Я г (і — номер 
точки). 

Ясно, что задача поиска минимума произвольной достаточно 
гладкой функции может быть сведена к решению системы нелинейных 
уравнений 

§габ / = 0 (III, 44) 

дающих необходимые условия минимума функции / (х). Поскольку 
матрица Якоби ^ системы (III, 44) является гессианом О функции 
/ (х), все соотношения (II, 14), (II, 28), (II, 30) будут выполняться, 
только вместо ^ в них должна стоять матрица О, а вектор уі будет 
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определяться формулой (III, 7). Аппроксимация В* (самого гёссиана) 
и Я; (обратного гессиана) должны удовлетворять соотношениям 
(II, 25), (II, 29), (II, 33) и соотношениям (II, 31), (II, 32), (II, 34) 
соответственно. 

Для решения системы (III, 44) может быть применен любой из 
квазиньютоновских методов, описанных в главе II. Тем не менее, 
имеет смысл самостоятельно рассмотреть задачу разработки квази- 
ньютоновских методов минимизации, поскольку имеется ряд свойств 
этой задачи, использование которых позволяет строить более эффек- 
тивные алгоритмы. Остановимся на этих свойствах. 

1. Гессиан О является симметричной матрицей 

а т =0 (111,45) 

2. В окрестности минимума функция / ( х ) может быть достаточно 
хорошо аппроксимирована квадратичной формой с положительно 
определенной матрицей. Это значит, что в достаточно малой окрест- 
ности точки минимума функции / гессиан О будет положительно 
определенным 

0> о (Ш,46) 

3. В каждой точке х, известно направление (это направление 
антиградиента), которое дает наискорейшее уменьшение функции 

В случае решения систем нелинейных уравнений аналогов этих 
свойств нет. При построении приближений к гессиану (обратному 
гессиану) естественно потребовать, чтобы они удовлетворяли воз- 
можно большему числу свойств, которыми обладает сам гессиан 
(обратный гессиан). Имея в виду свойства (III, 45), в большинстве 
случаев будет требовать, чтобы матрицы В ( , Я, были симметричными 

В] = В. н] = н с (111,47) 

Кроме того, желательно, чтобы матрицы Д, Я,, были положительно 
определенными 

Ві> 0, Ні>0 (ІИ, 48) 

| 

I После определения матрицы Я* (Д) направление поиска рі [по ана- 
і логии с ньютоновским шагом, см. выражения (II, 12), (II, 13) 3 
I находится либо с помощью уравнения (I, 41 ), либо решением системы 
линейных уравнений 

I ВіРі = ~іі (111,49) 

| Свойство 3 обычно используется для проверки того, является ли 
; данное направление направлением спуска. Поскольку выполняется 
; формула 

4 р т 

1 <1Рі || Рі || 8і 

проверяют условия 

Р? (-*,)> О (111,50) 

При их выполнении производная (1[/йр меньше нуля, и направление 
Рі есть направление спуска. Если выполняется условие (III, 48), 
то неравенство (III, 50) удовлетворяется автоматически [см. выра- 
жение (I, 44) 1. 
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Аналогично тому, как было сделано при разработке квазинью- 
тоновских методов решения систем нелинейных уравнений, рас- 
смотрим квазиньютоновские методы 1-го рода, в которых матрицы 
Ві, Ні будут удовлетворять соотношениям (II, 25,) (II, 31) соответ- 
ственно, и квазиньютоновские методы 2-го рода, в которых матрицы 
В іг Н, будут удовлетворять соотношениям (II, 29), (II, 32) соот- 
ветственно. Так же, как и в главе II воспользуемся соотношениями 
(II, 38), (II, 56). 

Для простоты обозначений вместо матрицы В і+1 , Н і+1 и В ь 
Ні будем иногда писать В, Н и В, Н, соответственно. Для построе- 
ния квазиньютоновских методов 1-го рода используем вариационный 
подход, а для построения квазиньютоновских методов 2-го рода — 
технику псевдообратных матриц. При применении вариационного 
подхода необходим критерий, минимизация которого дает возмож- 
ность определить матрицы Е, И. Прежде всего, конечно, применим 
принцип наименьшего изменения аппроксимирующих матриц на 
каждой итерации, при котором в качестве критерия используется 
норма Фробениуса 'матриц Е или Б. Основное отличие вывода квази- 
ньютоновских методов минимизации 1-го рода от выхода 
квазиньютоновских методов 1-го рода, предназначенных для р е - 
шения систем нелинейных уравнений, будет состоять в тре- 
бовании симметричности матриц В ІУ Ні, т. е. в выполнении условий 
(Ш, 47). , 

Свойство 3 дает возможность поставить другую экстремальную 
задачу для получения матрицы Е. А именно, матрица Е может быть 
найдена из условия минимизации угла между направлением поиска 
и направлением градиента. В этом случае решается задача 

тіп рТ +1| г. +1 || Рі ||=1 (111,51) 

при выполнении квазиньютоновских и каких-либо других условий. 
Другими словами в этом случае ищется направление наискорейшего 
спуска при выполнении квазиньютоновских и других условий. 


Квазиньютоновские методы минимизации І-го рода 

Вначале рассмотрим случай построения приближения к самому 
гессиану. Для получения матрицы Е [см. равенство (II, 38) ] восполь- 
зуемся принципом наименьшего изменения матрицы В При этом 
матрица В, +1 должна удовлетворять квазиньютоновскому условию 
1-го рода (II, 25) и условию симметричности (III, 47). Отсюда сле- 
дует, что матрица Е должна удовлетворять условию (II, 39) и усло- 
вию симметричности. Итак, матрица Е будет определяться как реше- 
ние следующей задачи 

тіп || Е ||р (111,52) 

е і і 


где 


Е Т ==Е 


(III, 54) 
(III, 55) 
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г і - Уі — 


Чтобы удовлетворить условию симметричности (ІИ, 54) будем ис- 
кать матрицу Е в виде: 

Е = 0,5 (с + С т ) (111,56) 

где С — произвольная матрица. Задача (III, 52) — (III, 54) перепи- 
шется в виде 

тіп||С + С т ||г (СД- С т ) 5] = 2 г] 

С І} 

Для решения этой задачи воспользуемся методом множителей Лаг- 
ранжа. Функция Лагранжа будет иметь вид: 

п п п п 

1 = ^ ^ {си + Сіи) 2 + ^ 2 { с м + е л) $ 1, ъ 

к = 1 /= 1 к = 1 1=1 

где с ѣ — элемент матрицы С. Приравняв производные Ь по с ір 
нулю, получим 

0,25 (с; р Д- Срі) Д- 0,25 (Срі -)- сір) -(- Я (5р > у -|- крЗ^ ^ = 0 

Из равенства (III, 56) вытекает, что е ір = 0,5 (с, р -)- с рі ) 
предыдущее равенство принимает вид 

Сір — — (Я ;5р > і Я рЗі, у) (III, 57) 

Легко проверить, что соотношения (III, 57) эквивалентны следую- 
щему матричному соотношению: 

Е = — (Яху Д- 5 / Я т ) (111,58) 

Представляя это значение Е в уравнение (III, 53), получим: 


Выразим Я через остальные члены 

*■ = -5Г ~ М (111,59) 

где а = 5/5/; ' р = Я т 5/. 

Заметим, что р — неизвестная константа, поскольку она зависит 
от величины Я. Для определения р подставим выражение (III, 59) 
для Я в уравнение (III, 58), и после несложных преобразований по- 
лучим 

(- 2 Р/+-5Г г 7 8 /) 8 / = ° ( ш > 6 °) 

Однако вектор 5/ не равен нулю; поэтому сумма, стоящая в скобках 
в равенстве (III, 60), равна нулю, следовательно, 

Р = — г)з і І2а (111,61) 

Подставляя значение Я из выражения (III, 58) в формулу (III, 57) 
и используя значение р из выражения (III, 61), получим 

Е = ДГ ( г / 8 / + V/) - ~5Г . (И 1 , 62) 
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Воспользовавшись выражением (III, 55) для г,- и соотношением 
(II, 38), получим рекуррентную формулу для определения В; 


В, 


7’+і 


:Ві + 


( у і ~ в / 5 /) 5 / + в / (У/ - в / 8 /У (У/ - в /*і) т */*/*/ 


5 /5/ 


(*/)’ 


(III, 63) 


Эта формула была впервые получена Пауэллом, который применил 
к формуле Бройдена (11,47) технику симметризации [62, с. 31]. 
Рекуррентная формула носит название преобразование РЗВ (Ро\ѵе11— 
зугатеігіс Вгоуйеп), а матрица В ; - +1 , подсчитываемая с помощью 
формулы (III, 63), обозначается через В Р5в . Остановимся теперь 
на случае, когда ищется аппроксимация Ні обратного гессиана. 
Матрица Н иі ищется в виде (II, 56). Для определения опять 
используется принцип наименьшего изменения матрицы при условии 
выполнения квазиньютоновских соотношений (II, 31) [см. также 
(II, 58)] и условия симметричности (III, 47). Итак, задача определе- 
ния будет иметь вид 

тіп||І)|| / ? 

Л Ч 

Оуі = Ш] Я т = .0 (111,64) 

где гл.} = 5у — Н іУ] . 

Действуя аналогично выводу формулы (III, 63), можно получить 
[27 ] 

Я/ +1 *» Н] + Од г 
где 

ц » - >1 + «1 Чі - "Ж + (ігхжше (ІІІів5) 

У;У/ (у}у;) 2 

Получим теперь выражение для В иі , исходя из условия, что в ка- 
честве критерия минимизации при, определении матрицы Е исполь- 
зована норма Фробениуса некоторой взвешенной матрицы 

Р = (111,66) 

где № — симметричная, невырожденная пх «-матрица [28]. Из 
формулы (III, 66) имеем 

Е = Г-іуг-і (Ш.67) 

Итак, матрица Е определяется как решение задачи 

тіп|| ѴЕѴ\\р (111,68) 

е і! 

ЕЗ} = Г}, Е т = Е 

Подставляя выражение (III, 67) для Е в (III, 68), придем к следую- 
щей задаче 

тіпЦѴЦр (111,69) 

Ѵ И 


где 


Ѵіі = ?і Ѵ т = V 


= Ц7~ Ѵ> г і = 117 у/у _ Ц7Д 


(ІИ, 70) 

УЯ (III, 71) 

Задача (III, 69) выглядит так же, как задача (III, 52) — (III, 54), 
только роль матрицы Е играет матрица V, а векторы 8], г 1 заменены 
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соответственно векторами 5;, г По аналогии с (III, 62) мы можем 
сразу выписать выражение для V 


V = 


(V/ + V/) 


*?/ 


г / 5 / 5 / 5 / 

(*;*/)* 


(III, 72) 


Подставляя вместо /у, $/ их значения из формул (III, 71), умножая 
полученное выражение слева на и справа на ѴР и используя 
формулу (III, 67), получим выражение для Е: 


Е = 
где 


( У) — Ві 3 і) (М5]) т 4 ~ (М$і) ( У) — Вр-,) 

(5/, Мз;) 


в)(у і ~ в І в І ) (М*,) (М 3/ у 
(В}, ЩР 


м = иг -2 


(ІИ, 73) 

(III, 74) 


Введем обозначение с ** Мз, подставим выражение (III, 73) для Е 
в формулу (II, 38) и используя для В і+1 , Я, +1 обозначения В, Н, 
соответственно, получим 


ЁГ_ в . I (Уі С Т “Ь С ( У) — В/8/) Т 


*/(У/- в і $ /) ссТ 

(В;, С) 2 


(III, 75) 


Получим теперь выражение для Я 7 -, исходя из условия, что в качестве 
критерия минимизации при определении матрицы Я будет исполь- 
зована норма Фробениуса некоторой взвешенной матрицы ѴРБѴР 
(где ѴР — симметричная, невырожденная пХп- матрица). В данном 
случае матрица Е> будет определяться как решение задачи 

тіп || ѴРОѴР ||/? (111,76) 

й іі 


Руз = т і В Т = В 


і 

I 


Проводя вывод такой же, как и в предыдущем случае, легко получить 

■ц . н | (Ц ~ НіУі) Ь Т + Ь(в } - Я,щ) т У) (»/ ~ Н,у,) ЬЬ Г 

(VI, Ь) 
где 


(уз, ь)' 


ь . 0у 3 , С} = ІГ-» 


(III, 77) 
(III, 78) 


В формулах (III, 75), (III, 77) имеются произвольные матрицы М, (2, 
конкретный выбор которых позволяет получить различные формулы 
для определения В, Я. Если матрицу М в выражении (III, 75) 
выбрать так, чтобы она удовлетворяла уравнению 


Мвз = у } (Ш,79) 

то полученная матрица В будет обладать следующим свойством: 
обратная ей матрица В -1 будет давать известную формулу Давидона — 
Флетчера— Пауэлла (ОРР) [63]. В связи с этим обозначим матрицу В 
через В 0РР , а обратную ей — через Н 0 рр\ тогда из соотношения 
(III, 75) имеем 


Ворр = В] 


(У/ ~ в і 5 Р У/ + У/(У/~ Ѵ/) т »/ (У/ ~ В Д ) УіУ) 


Щ) 


(*/• Ѵі) 2 


(III, 80) 
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а Нр>р Р имеет вид 


Н 0 рр = Н ] -\ 1 -~- 

*1*І 


н іУіУ) н і 

у} н / у / 


(ПІ, 81) 


Доказательство факта, что Нор Р = Ввр Р проводится непо- 
средственной проверкой соотношения Н 0РР -В 0 р Р = /„. Если 
матрицу (2 в формуле (III, 77) выбрать удовлетворяющей уравнению 

Чуі = $і (111,82) 

то придем к формуле 


В 


. », + .( 8 /- я /У/)*7 + 8 /(Ѵ 

(Уі, */) 


■ад »;(»/■ 


■ Н іУ !)*/*} 


(УГ ^) 2 


(III, 83) 


которая после несложных преобразований может быть приведена 

к виду, представляющему известную формулу Бройдена — Флетчеоа 

Гольдфарба— Шенно (ВРС8) [64; 65]: Р 


В враз — В і + 


1 + 


у]в іУі 


т т 

8 І 5 І 


^7"/ + ад 


в іУі 




(ІИ, 84) 


Проанализируем полученные преобразования (III, 63), (III, 65), 
(III, 81), (III, 83): Вычислительный опыт показывает [27], что фор- 
мула (III, 65) работает не вполне удовлетворительно, лучшие ре- 
зультаты дает формула Р8В (III, 63). Однако и это преобразование 
уступает формулам (III, 80), (III, 83). Формула (III, 81) (метод 
иг В) получила очень большое распространение и во многих случаях 
показывает очень большую эффективность. И наконец, преобразо- 
вание ВВОЗ (III, 83) считается одним из лучших с точки зрения 
быстроты сходимости. 

Эти формулы будут получены также при рассмотрении квази- 
ньютон зских методов 2-го рода. Там же будет показано что не- 
смотря на то, что в обоих случаях матрица Ві, Ні удовлетворяет 
только одному квазиньютоновскому условию (II, 25), (II, 31) 
в текущей точке поиска, оба эти метода обеспечивают нахождение 
минимума положительно определенной квадратичной формы за 
конечное число шагов. Таким образом, если при конструировании 
квазиньютоновских методов расчета систем нелинейных уравнений 
лучшие результаты дает минимизация нормы Фробениуса матрицы Е 
при аппроксимации самой матрицы Якоби, то при конструировании 
квазиньютоновских методов минимизации лучшие результаты дает 
минимизация нормы Фробениуса взвешенной матрицы Е при аппро- 
ксимации самого гессиана и минимизация взвешенной матрицы Г) 
при аппроксимации обратного гессиана. 

Попробуем дать этому факту качественное объяснение [28]. 
Будем исходить из предположения, что М положительно определен- 
ная матрица, тогда существует матрица Л4 1/2 . С учетом (III 74) 
соотношение (III, 66) может быть переписано в виде 


V = М~ 1/2 ВМ~ 1/2 
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(III, 85) 


! 

: Произведем замену переменных х = М^ 2 х для функции / (х), тогда 
, I (х) — / (/И~ 1/2 х). Гессиан функции / (х) раве" 

— М -1/2 ѵ 2 /Л1 _1/2 

Отсюда матрицы 

М~ 1/2 ВМ~ 1/2 и М- и2 ВМ~ 1/2 

будут давать приближение к гессиану функции (л:) в точках х іг 
х і+і соответственно. .Поставим теперь задачу построить квазинью- 
тоновский метод 1-го рода для минимизации функции / (х). Исполь- 
зуя принцип наименьшего изменения аппроксимирующей матрицы, 
по аналогии с задачей (III, 51) — (III, 53) получим 

тіп || М~ 1/2 ВМ~ 1/2 — М~ 1/2 ВМ~ [/2 ||/і- 
М- 1/2 ВМ~ 1/2 ^ = у) 

(м~ѵ 2 вм-ѵ 2 у = (УИ~ І/2 ВЛ1~ 1/2 ) 

где через з^, у 7 - обозначены величины 5 7 , у^ в пространстве перемен- 

Н Ы X X . 

Покажем, что задача (III, 88) — (III, 90) сводится к задаче (III, 68). 
Действительно, подставив выражение (II, 38) в выражение 
(III, 88) и используя формулу (III, 74), получим выражение (III, 68). 
Используя симметричность матрицы М из (III, 90), легко получить 
условие В т = В и отсюда условие Е т = Е. Далее заметим, что 
имеют место соотношения ^ = М^ 2 у^. Подставляя 

эти выражения в (III, 89) после несложных преобразований, получим 
условие Вз] = у } , которое эквивалентно условию Ез^ = г } (с. 34). 
Итак, задача (III, 68) дает матрицу Е, следовательно и В, на основе 
которой мы получаем квазиньютоновские преобразования (III, 75) 
для пространства х. 

Почему же все-таки преобразование, полученное на основе задачи 
; (ПІ, 68) обеспечивает хорошие практические результаты. Дело 
і в том, что пространство * можно сделать очень удобным для поиско- 
- вых методов соответствующим подбором матрицы М. Действительно, 

• если выбрать М — ѵѵ (х*), где х* — минимум функции Их), то 

• в точке минимума гессиан (III, 86) функции * (х) будет равен еди- 
! ничной матрице. Таким образом, в пространстве х в окрестности 
‘ минимума поверхности уровня функции / (х) близки к гиперсферам. 

Это наиболее благоприятная ситуация для поисковых методов, 
и если бы мы действительно могли выбрать М = у 2 / (**). это объя- 
сняло бы причины хорошей работы преобразования (III, 75). К со- 
жалению, мы заранее не знаем матрицы у 2 / (х*). Однако можно счи- 
» ^ т0 мат Р ица М является некоторым приближением к матрице 

■ V / \ х )> поскольку она является симметричной, положительно оп- 
: ределенной и удовлетворяет квазиньютоновскому условию (III, 79). 
Отсюда и преобразование (III, 75), полученное с использованием 
этой матрицы, должно показывать результаты, близкие к тем, ко- 
торые бы мы имели при М = у 2 / (х*). 


(III, 88) 
(III, 89) 
(III, 90) 


(III, 86) 
(III, 87) 
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Рассмотрим теперь случай, когда ищется аппроксимация к об- 
ратному гессиану. Будем предполагать, что матрица 0 [см. выраже- 
ния (111,78)] является положительно определенной. 

Введем замену переменных х ш (2~ І/2 х и проанализируем функ- 
цию / {х) = / (0} 2 х). Гессиан и обратный гессиан функции ! (х) 
равны 0. 1/2 у 2 [0 1/2 , 0г х/2 (ѵ 2 /)“^- 1/2 , соответственно. Приближение 
к обратному гессиану функции ! (х) будет иметь вид (2*1 2 Н(}- 1 > 2 , 
где по-прежнему Н есть приближение к обратному гессиану функции 
/ (х). Проведя рассуждение такие же, как и в предыдущем случае, 
можно показать, что задача (III, 76) эквивалентна построению при- 
ближения к обратному гессиану в пространстве х. Отсюда, если 
матрица ф будет близка к обратному гессиану в точке минимума, 
то в, окрестности точки минимума функция ! (х) будет иметь гессиан, 
близкий к единичной матрице, и, следовательно, мы опять приходим 
к ситуации, наиболее благоприятной для методов спуска. Но функ- 
ция ф является симметричной, положительно определенной и удов- 
летворяет квазиньютоновСкому условию (III, 82), поэтому можно 
считать, что она действительно является приближением к об- 
ратному гессиану. Это и объясняет хорошую работу формулы (III, 84). 

Проведенные рассуждения имеют значение не только с точки 
зрения объяснения хорошей работы формул (111,81), (111,84), 
они обосновывают целесообразность использования взвешенных 
матриц ѴРЕѴУ, I ѴОѴР при рассмотрении новых случаев. 

К вазиньютоновские методы минимизации 2-го рода 

Вначале рассмотрим методы минимизации квадратичных функций 
(III, 2). Аппроксимация В і прямого и Я 7 - обратного гессианов будем 
искать с помощью соотношений (И, 29) и (II, 32) соответственно. 
На первой стадии будем вести изложение применительно к случаю, 
когда ищется матрица Н и В статье [33] (см. также [11, с. 63]) 
показано, что, если векторы рі строятся в соответствие с формулой 
(1,41), в которой Н ( удовлетворяет соотношению (II, 32), а коэффи- 
циенты с*і — условию (I, 47), то поисковые направления будут со- 
пряженными, и, следовательно, минимум функции (III, 2) будет 
найден на п-м шаге. Кроме того, в л-й точке будет выполняться со- 
отношение 

#п = Л-і (III, 91) 

Действительно, используя формулу (III, 8) и правило перемножения 
клеточных матриц, легко проверить, что матрицы У 8] связаны 
следующими соотношениями: 

ѵ і = А5 / 8 / = Л- V/ У] = 5}Л (III, 92) 

Пусть теперь построены я ненулевых сопряженных векторов 5 0 , ... 
.... 5 п _і. Положим і = п в соотношении (II, 32), тогда 

Я„Г„ = 5„ (111,93) 

Как было показано (см. с. 85), векторы у 0 , ..., у п _ х в этом случае 
линейно-независимы. Следовательно, существует обратная мат- 
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рица У п . Умножая равенство (III, 93) справа на матрицу V 
и подставляя в полученное выражение З п из соотношений (III 92) 
легко получить формулу (III, 91). ’ 

Определение вида матрицы Н В гл. II было получено общее 
решение системы (II, 32). Оно имеет вид (II, 90), (II, 91). Это общее 
решение можно применить и в данном случае. Могут использоваться 
также и все частные формулы (II, 97) — (II, 102), которые были по- 
лучены из общего выражения при некоторых частных значениях 
произвольных постоянных. 

Остановимся еще раз на проблеме определения вектора п, в фор- 
муле (II, 101); как уже указывалось (см. с. 44) вектор с,- может 
быть выбран: 

1) как столбец единичной матрицы / п ; 

2) из условия максимума абсолютной величины знаменателя 
правой части формулы (II, 101); 

3 ) из условия максимума абсолютной величины определителя 

матрицы Н і+1 ; г 

4) из условия минимума нормы Фробениуса второго члена правой 

части формулы (II, 101). ѵ 

Свойство 3 оптимизационной задачи (см. с. 87) позволяет нахо- 
дить Сі из условия минимальности (при определенных условиях) 
угла между направлениями антиградиента и поиска. Математически 
задача определения вектора в данном случае формулируется в виде 
(111,51), где 'р і+1 определяется формулой (1,41), а Н ил — соот- 
ношением (II, 1 0 1 ) . Однако условие ||/? г+1 | = 1 приводит к суще- 
ственному усложнению задачи. Поэтому заменим его более про- 
стым. I с ь I = 1 Подставляя в выражение (III, 51) значение р 1+1 
из формулы (1,41) и Ні+і из формулы (II, 101) и заменяя условие 
1 Рі+і II — 1 условием || с,- И = 1, придем к следующей задаче: 


тіп -т 

™ 8І+ ' ^ — *+• 


'= 1 


(III, 94) 


Поскольку Ёс-і ($; Ніуі) есть скаляр, а с]Кі, КіУі — векторы, 
это выражение является задачей типа (II, 77), решение которой было 
уже рассмотрено. 

За метим, что матрица # /+1 , определяемая формулами (11,90), (11,91), не обла- 
дает ни свойством симметричности, ни свойством положительной определенности. 

ЛЯЛИНЫ ч™и Т г!п' 10 получить частные формулы этого семейства, которые обла- 
дали бы этими свойствами. Покажем вначале, что общая формула 


Ні + \ — Ні -(- 


8 і ( а іі -у]н ( + р и $,) 


Уі (УиУ]Н с + 6,3) 

+ѵ;)» ( " ІІ: х> 
<“■*»■ С.9Ч- д«- 

Пусть в точке і выполняются условия 


аТК . = 0 
НіУі =. 5 * 


(III, 96) 


(III, 97) 
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Тогда в точке і 4- 1 будут выполняться условия 

5 Ж К .-+і = ° (111,98) 

Ні+іУі+і = 5( + і (III, 99) 

Равенство (111,96) является условием сопряженности [см. выражение (111,19)]. 
Соотношение (111,98) доказано (см. [11, с. 63)], поэтому докажем правильность 
соотношения (111,99). Пусть постоянные йц, сц (} = 1, 2) определяются с помощью 
формул: 

а іі = а цЩѴі + Р/А 7 = 1.2 (III, 100) 

с і І = У/іЩУі + 6/А- / = 1 ■ 2 (111,101) 

где ал, $л, уц, бц — произвольные постоянные. Используя выражение (111,100) 
для А ] - і и (11,88) для получим: 


Л 


= а /іУІ Н і + Р/АІ - “ііУІНМ - 


(III, 102) 


На основании равенства (111,96) последний член выражения (111,102) равен нулю. 
Используя соотношения (111,97), (111,20), легко показать, что предпоследний член 
правой части равенства (111,102) также равен нулю. Итак 

^ = “/Л + М (ін. ЮЗ) 

Проводя аналогичные преобразования, можно показать, что 

е )іК[ = ЧцУі н і + VI (ш. і° 4 ) 

Перегруппируем члены в правой части соотношения (11,90) 


Них = Ні 




ѴіУі 


■Ні 


+ ЩУс 


Яуі 


уМ 

‘нК'іУі 

«и* \ 


'иЧУ/ «2 іЩУі 


1 


'2 і 


2і 


к? 


сЩУі 


+ 


(III, 105) 


Подставляя в последнюю скобку правой части равенства (111,105) выражения 
(111,104) для с Т цК\ , легко показать, что член в этой скобке будет равен нулю, если 
константы у л, 6/; удовлетворяют соотношению 

У1І&2І = У2І&1І (III, 106) 

В дальнейшем будем исходить из предположения, что константы уц, бц выби- 
раются произвольно, а константы у 2 ;, 6 2 г с учетом выполнения этого равенства. 
Рассмотрим предпоследнюю скобку в правой части равенства (111,105). Коэффи- 
циенты у 2 і> б 2 ; в формуле (111,101) связаны соотношением (111,106), величины же 
^ 2 ,- произвольны. Поэтому мы можем выбрать их таким образом, чтобы член, стоящий 
в этой скобке, также обратился в нуль. Подставляя теперь в равенство (111,105) 
выражения (111,103), (111,104) для <^цК\ и с т и к \ , получим формулу (111,95). Но 
#і + і из выражения (11,90) удовлетворяет уравнению (111,99), следовательно, 
и Ні +1 из формулы (111,95) удовлетворяет уравнению (111,99). 

Покажем теперь, что условия (111,98), (III, 99) выполняются при і = 0. Умно- 
жим справа соотношение (111,95) при і — 0 на у 0 , после несложных преобразований 
получим Ніу 0 = 5 0 , что и доказывает правильность соотношения (111,99). Правиль- 
ность соотношения 5|У 0 = 0 была доказана (см. [11, с. 63]). 

Совокупность конкретных формул для вычисления Я;, которые получаются из 
выражения (111,95), если давать определенные значения произвольным постоянным 
ал, ру; , у л, б л , для краткости будем называть семейством формул (алгоритмов) 
Хуанга. Интересно отметить, что в то время, как в формулах (11,90), (11,91) в об- 
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щем случае требуется запоминать три матрицы (Я ; , К}, К'}), в формуле Хуанга за- 
поминать надо только одну матрицу Я*. Однако преимущество формул (11,90), 
(11,91) состоит в том, что они позволяют строить приближения к прямому или обрат- 
ному гессиану с помощью любой совокупности векторов 5;, уі (важно только, 
чтобы они были линейно независимыми). Применение же формулы Хуанга ограни- 
чивается случаем, когда направления являются сопряженными. Приведем некото- 
рые известные алгоритмы, которые могут быть получены из формулы (111,95), при 
различных значениях параметров а іг , р і; , у г і, 6ц. 

Формула Давидона — Флетчера — Пауэлла ( ОРР ), р х ; = 1, 6 Х ; = 0, а іг = 0, 
у 1г - = 1, [см. выражение (III ,81) ] . 

Формула Маккормика, Р Х г = 1, а іг = 0, = 1 , у і; = 0 


Н і+1 = Ні + 


*іУі 


Формула Пирсона [31], Р іг = 0, а і; = 1, 6 іг = 0, Ѵіі = 1 

(. а і-Н і Уі)«[Н 1 


я 


г+1 : 


Ні- 


УІИіУі 


Семейство преобразований Бройдеиа. Если решение Я; матричного уравнения 
(11,32) искать в классе симметричных матриц (Я; — аппроксимация симметричного 
обратного гессиана), то преобразованию (111,95) можно придать следующий вид 
[11, с. 74-75]: 


где 


Н і+ 1 = Щ ■ 


"іУіУІНі 


в іУі 

ѳ і =■ Р (УІ Н іУі) в ІУі 


УІНіУі 




Нт 


в іУі У Т і н іУі 


(III, 107) 

(III, 108) 


Семейство (111,107) — (111,108) преобразований матрицы Я; с произвольным Р рас- 
сматривалось Бройденом [67]. Интересно отметить, что преобразования ЁРР и 
ВРСР, содержащиеся в уравнениях (111,107), (111,108) соответственно при Ѳ; = 0 
и Ѳ. = у\Н і у і были получены ранее [см. формулы (111,81), (111,84) ] с использова- 
нием минимизации нормы Фробениуса. 

В работах [68; 65] показано, что в определенном смысле формула ВРСЗ (111,84) 
является наилучшей в семействе (111,107) при Ѳ; > 0: соответствующие матрицы Я; 
обладают наибольшей величиной минимального собственного значения и, кроме того, 
при минимизации квадратичной функции с положительно определенной матрицей О 
эвклидова норма матрицы Е і , т. е. | Е і | = Тг (Е]Е { ), определенной в виде Е ( = 
= ВНф — В 2 = О, монотонно уменьшается: | Д;+і | < | Я* |. 

Среди других преобразований следует отметить 55ЕЛ4, входящее в двухпара- 
метрическое семейство Орена [69—71], см. также работу [11, с. 76]. 

Аппроксимация прямого гессиана. В этом случае матрица В; должна удовлет- 
ворять уравнению (11,29). Аналогично выводу соотношения (111,91) можно пока- 
зать, что если построены п линейно-независимых направлений з 0 $ п ~і, то на 

п - м шаге будет выполняться равенство 


В п = А (111,109) 

Если направления з 0 , .... $„_! сопряженные, то их линейная независимость гаран- 
тируется (см. с. 81). 

Все что было сказано относительно квазиньютоновских методов 2-го рода для 
решения систем нелинейных уравнений (см. с. 46), может быть повторено для 
этого случая, поэтому не будем здесь на этом останавливаться. 

4 Островский Г. М. 
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Применение квазиньютоновских методов 
к минимизации произвольных функций 

Теория квадратичных методов минимизации, изложенная в начале 
этой главы, основана на исследовании задачи о минимуме квадратич- 
ной функции. Возможность применения этих методов к минимизации 
произвольных, т. е. неквадратичных функций связана с тем, что при 
выполнении известных условий неквадратичную функцию в некото- 
рой окрестности точки минимума можно с определенной точностью 
аппроксимировать квадратичной функцией. Некоторые свойства 
квадратичных методов минимизации — устойчивость, идентичность 
генерируемых последовательностей — -установлены, по существу, 
для неквадратичных минимизируемых функций [67; 72; И, с. 76 — 
81 ]. Окончательное решение вопроса о возможности применения ква- 
дратичных методов к минимизации неквадратичных функций опре- 
деляется исследованием сходимости рассматриваемых методов, так как 
свойство конечности алгоритма (достижение минимума за конечное 
число итераций) для неквадратичных минимизируемых функций, 
вообще говоря, не выполняется. Для многих, наиболее часто приме- 
няемых квадратичных методов минимизации не только доказано 
свойство сходимости, но и получены оценки скорости сходимости, 
которая оказывается сверхлинейной [154, 155]. В то же время 
метод наискорейшего спуска, например, характеризуется, в общем, 
более слабой — линейной скоростью сходимости. Практическое под- 
тверждение этих теоретических соображений основывается на резуль- 
татах решения тестовых задач различными методами и последующей 
их сравнительной оценке. 

В этом разделе на основе тестовых примеров будут приведены 
некоторые характеристики рассмотренных выше алгоритмов 
минимизации. Рассмотрим в общих чертах описание некоторых со- 
ставных частей применяемых квадратичных алгоритмов миними- 
зации. 

В главе I были рассмотрены общие принципы построения широ- 
кого класса алгоритмов безусловной минимизации и приведена их 
структурная схема (см. рис. 4). Из этой схемы явствует, что каждый 
алгоритм минимизации имеет неотъемлемую составную часть — 
процедуру одномерного спуска. Избранный алгоритм одномерного 
движения во многом определяет эффективность применяемого алго- 
ритма безусловной минимизации. В качестве процедуры одномерного 
движения для большинства рассматриваемых здесь алгоритмов мини- 
мизации принят процесс вычисления значений минимизируемой функ- 
ции в последовательно определяемых точках в заданном направ- 
лении «спуска»; этот процесс выполняется до того момента, когда 
не будет найдена первая точка, в которой значение функции меньше, 
чем в двух соседних точках. Применяемая затем параболическая 
интерполяция позволяет, в общем случае, улучшить результат, 
т. е. определить точку с меньшим, чем найденное выше, значением 
функции. Организованная таким образом процедура линейного 
поиска дает точное положение минимума (а, = а,-) функции в дан- 
ном направлении р г при минимизации квадратичной функции. С це- 
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лью выбора наиболее «подходящей» (с точки зрения сокращения 
числа последующих вычислений функции) величины начального 
шага в направлении «спуска» в принятом алгоритме одномерной ми- 
нимизации предусмотрен анализ процесса линейного поиска, опре- 
деляющий значение начального шага для каждого следующего на- 
правления движения (так называемая «адаптация» начального шага). 
Для первого направления «спуска» (р 0 = — § 0 ) величина начального 
шага выбирается с учетом предварительных соображений о характере 
задачи или же произвольным образом. 

В некоторых случаях метод 55ѴМ применялся в сочетании с не- 
сколько иным методом одномерного поиска. Величина начального 
шага вдоль направления рі зависела от интервала на числовой пря- 
мой, в котором оказывалось текущее значение |/? г ||. Если параболи- 
ческая интерполяция выполнялась в окрестности начальной точки 
вектора р,-, то учитывалось значение производной минимизируемой 
функции по направлению р г в этой точке: р г )-, интерполяция 

в этом случае проводилась по двум точкам. Это вело к сокращению 
числа вычислений функции в процессе поиска. Если же интерполя- 
ция выполнялась по трем точкам, то в случае «близости» найденного 
положения минимума параболы и средней из узловых точек послед- 
няя принималась за точку минимума данной функции в направлении 
Рі • Это также способствовало уменьшению объема вычислений. В при- 
водимых далее табл. 8 — 16 соответствующие результаты (с двойной 
точностью) даны в фигурных скобках. 

Изложенные методы одномерной минимизации являются по су- 
ществу методами нулевого порядка, т. е. в’точках прямой рі выпол- 
няется расчет лишь значений минимизируемой функции. Если же 
в каждой точке известны и значения градиента данной функции, то 
могут быть использованы теоретически более эффективные алго- 
ритмы одномерного поиска, основанные на применении так назы- 
ваемых критериев сходимости. При этом автоматически обеспечива- 
ется выполнение условия (III, 163), связанного с устойчивостью 
алгоритма минимизации. Для обеспечения критерия сходимости 
в случае его невыполнения на первом шаге обычно используются 
методы линейной экстраполяции совместно с кубической интерполя- 
цией (см. Приложение 2). По данным решения тестовых задач методы 
первого порядка требуют в среднем 1,1 — 1,5 вычислений функции 
(вместе с градиентом) на направлении по сравнению с 2,5—4 вы- 
числениями при методах нулевого порядка. 

Алгоритм одномерного поиска первого порядка входит как состав- 
ная часть в 5\ѵі1сЬ-метод Флетчера [65], в котором используются 
преобразования матриц (III, 80) с прямой аппроксимацией гессиана, 
представленных в факторизованном виде. Результаты тестовых ис- 
пытаний этого метода даны в табл. 8—17 (строка 5\У). Следует отме- 
тить, что при работе с алгоритмами оптимизации, использующими 
две матрицы для построения обратного гессиана, например выраже- 
ния (II, 101), и (II, 102), техника работы с матрицами должна 
быть аналогична изложенной в главе II. Здесь рассматриваются 
алгоритмы, использующие одну матрицу преобразования, причем 


Таблица 8. Тестовая задача 1 (КОЗ 2) [156] 


Алгоритм 

минимизации 

*/ 

к Р 

і* 

Ій* 1 

ВРС5 

99 (91) 

24 (23) 

О 

1 

-3 

О 

1 

м 

кв 

10~ 7 (10-0) 

10-0 (0) 

. БРР 

106 (108) 

26 (25) 

ІО" 20 (0) 

55ѴМ 

120 (125) {120} 

30 (32) {33} 

10-14 (Ю-12) 

{ІО- 14 } 

10- 7 (10-0) 
{10-0} 

РКМ 

164 (133) 


ІО- 14 (0) 

ІО' 6 (0) 

5Ѵ 

56 (50) 

40 (41) 

ІО- 19 (0) 

ІО" 8 (0) 


Таблица 9. Тестовая задача 7 [63] 


Алгоритм 

минимизации 

К} 

Кр 

/* 

Ій* 1 

ВРОЗ 

101 (101) 

23 (23) 1 

10-“ (10"“) 

ІО- 7 (ІО- 7 ) 

БРР 

97 (104) 

24 (25) 

со 

V 

0 

СО 

>ч 

1 

О 

10-0 (10-8) 

ІО- 6 (Ю-5) 

{ ІО- 6 } 

55ѴМ 

107(118) {95} 

23 (25) {26} 

Ю-ю ( 10 -и\ 

{ іо- 14 } 

РКМ 

149 (186) 

32 (38) 

ІО" 12 (10- 10 ) 

ІО" 5 (ІО" 9 ) 

5Ѵ 

38 (38) 

29 (29) 

ІО" 19 (ІО' 21 ) 

ІО" 9 (ІО” 8 ) 


Таблица 10. Тестовая задача 12 (ТЕ8Т 10) [159] 


Алгоритм 

минимизации 


к Р 

/* 

Ій* 1 

враз 

ВРР 

53ѴМ 

РКМ 

5\Ѵ 

178 (180) 

918 (761) 

215 (205) {68} 

399 (351) 

96 (97) 

43 (45) 

225 (205) 

50 (51) {24} 

92 (79) 

81 (81) 

ІО" 14 (0) 

ІО" 18 (0) 

10-18 10-18) 
{10-18} 

І0-» (Ю-І8) 

іо- 17 ( 0 ) 

10-8 (0) 

10-8 (0) 

10-8 10-8) 
{10-8} 

10-8 (10-«) 

10-8 (0) 


Таблица И. Тестовая задача 13 (\ѴООБ 4) [160, с. 198] 


Алгоритм 

минимизации 

к ! 

К р 

/* 

Ій* 1 

враз 

156(161) 

42 (42) 

10' 11 (0) 

ІО" 4 (0) 

БРР 

184 (199) 

49 (51) 

ІО' 13 (10- 10 ) 

10-8 (Ю-4) 

53ѴМ 

120 (120) {86} 

26 (26) {22} 

10-” (Ю- 10 ) 
{10- 10 } 

10- 4 (10-8) 
{іо- 4 } 

РКМ 

296 (298) 

69 (69) 

10-ю (10-Ю) 

10- 4 (10- 4 ) 

5Ш 

99 (107) 


ІО" 18 (0) 

10- 7 (0) 


100 







































Таблица 12. Тестовая задача 14 (4ѴАТ8(ДО 9) [159] 


Алгоритм 

минимизации 

*! 

Кр 

1* . 

ій* 1 

ВР05 

159 (123) 

33 (25) 

0.1399760Х 

X ІО” 6 (10“ 4 ) 

10-* (ІО- 3 ) 

БРР 

178 (150) 

40 (31) 

0,1 399760 X 

X Ю _6 (ІО" 4 ) 

1 

0 

ад 

1 

О 

55ѴМ 

301 (171) (207} 

62 (38) {64} 

0.1399760Х 

X Ю" 6 (10- 4 ) 
{0,1399760- ІО' 5 } 

ІО- 6 (Ю- 3 ) 
{10-*} 

Р'КМ 

366 (225) 

77 (51) 

0.1399760Х 
х ю- 6 (іо- 6 ) 

10-0 (10~ 3 ) 

5\Ѵ 

96 (69) 

92 (58) 

0,1399760- ІО" 8 
(0,6656350- ІО' 6 ) 

ІО- 9 (Ю- 4 ) 

Таблица 

13. Тестовая задача 15 (\ѴАТ8(М 6) [15 9] 


Алгоритм 

минимизации 

*/ 

«Р 

(* 

Ій* 1 

ВР05 

99 (121) 

23 (24) 

0,2287670- ІО -2 
(0,2287605- ІО" 2 ) 

10-« (ІО- 3 ) 

БРР 

107 (152) 

27 (28) 

0,2287670- ІО" 2 
(0,2287475- ІО- 2 ) 

10-6(10-3) 

55ѴМ 

145 (218) {93} 

31 (36) {32} 

0,2287670- ІО" 2 
(0,2287537- 10“ 2 ) 
{(0,2287670- ІО" 3 )} 

10-* (10- 4 ) 
{10-*} 

РКМ 

192 (229) 

40 (37) 

0,2287670- 10"» 
(0,2287670- 10“*) 

10-* (10- 3 ) 


45 (44) 

42 (38) 

0,2287670- 10"» 
(0,2287555- 10"») 

10-' (10- 8 ) 

Таблица : 

14. Тестовая задача 16 (КО 5 8) [181] 


Алгоритм 

минимизации 

*/ 

к р 

1* 

1**1 

ВР05 

76 (55) 

18 (12) 

1 0 20 (Ю-М) 

ІО’» (0) 

БРР 

152 (184) 

37 (44) 

І^ 4 

н. 

1 

о 

о 

10-16 (Ю-1 3 ) 

55ѴМ 

52 (55) {82} 

11 (12) {26} 

^ о 

О 1 

|!і св 

<д> — ' 

О 

1 

о> 

ІО- 13 (0) 

{ 10-»} 

РКМ 

90 (101) 

25 (30) 

10-16 (10-16) 

ІО- 13 (ІО" 13 ) 

5^Ѵ 

Ч.' 1 ■ 1 111 - — 

111 (210) 

100 (182) 

о 4 

ч* 

1 

0 

чР 

ея 

1 

О 

10-2° (10-34) 
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Таблица 15. Тестовая задача 17 (ЕХР 5) [162] 


Алгоритм 

минимизации 



/* 

и* і 

ВР05 

298 (250) 

75 (61) 

ІО" 15 ПО" 12 ) 

ю- 7 (10-°) 

ОРР 

774 (404) 

187 (105) 

ІО" 2 (10- 12 ) 

ІО" 8 (іо- 7 ) 

ЗЗѴМ 

321 (341) (401} 

79(84) {127} 

о 

1 

10~ 7 (10- 6 ) 

{10-8} 

РКМ 

599 (1001) 

123 (193) 

10 -11 (ІО" 12 ) 

ІО- 7 (ІО- 7 ) 


121 (96) 

94 (76) 

10- 2 (10-2) 

ІО- 12 (10-8) 


Таблица 16. Тестовая задача 18 (ЕХР 4) [162] 


Алгоритм 

минимизации 


к р 

і* 

Ій* 1 

враз 

109 (174) 

24 (29) 

10-2° (Ю— 12) 

10-8 (ІО- 7 ) 

ИРР 

116 (154) 

27 (28) 

ІО" 17 (ІО- 12 ) 

10-8 (ІО- 7 ) 

53ѴМ 

111 (137) {80} 

25(27) {26} 

[0-20 (10-14) 

{ІО- 20 } 

10-8 (ІО- 7 ) 

{ІО- 10 } 

РКМ 

159 (197) 

35 (37) 

10-14 ( 10 -14) 

10-8 (ІО- 7 ) 

5\Ѵ 

44 (45) 

40 (40) 

Ю-ів (10-13) 

ІО- 10 (10-8) 


Таблица 17. Тестовая задача 19 (ШЕИШЬЬ) [163] 


Алгоритм 

минимизации 


к Р 

і* 

Ій*І 

враз 

166 (221) 


ІО" 17 (ІО' 10 ) 

ІО" 8 (ІО" 3 ) 

ОРР 

1155 (66) 

243 (8) 

Ю-І9 

(0,2134192- ІО' 1 ) 

ІО" 10 (10-8) 

ззѵм 

253 (121) 

50 (14) 

іо- 17 

(0,2133873- ІО" 1 ) 

ІО" 8 (ІО- 4 ) 

РКМ 

184 (465) 

26 (57) 

67 (16) 

Ю-14 (1 0 -10) 

ІО" 8 ( 10 -5) 

5\У 


ІО" 31 

(0,21341 19- ІО" 1 ) 

10-ю (10-4) 


Таблица 18. Тестовая задача 1 1 при ( х в )і 2 1,782 [152] 


Алгоритм минимизации 
<е = -15) 

К/ 

к р 


РКМ 

1914 

493 

ІО' 18 

ОРР 

414 


Ю-ів 

ВРОЗ 

388 

104 

10-19 

ззѵм 

407 

117 

ІО- 1 * 

ЗЗѴМ (е = —7) 

302 

91 

10-12 
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Рис. 13. Кривые роста числа вычисле- 
ний минимизируемой функции с увели- 
чением размерности тестовых задач: 
цифры у кривых соответствуют номерам 
тестовых задач (см. Приложение 1). 

в симметричной форме. Среди 
представленных здесь квадра- 
^ тичных методов минимиза- 
| ции: ВРС5 (III, 84), БЕР 
| (III, 81), РКМ (III, 40) и 55ѴМ, 
, я использующих алгоритмы одно- 
'I мерного спуска нулевого по- 
§ рядка, наилучшие результаты 
I дал метод ВР05. Вычисления 
В производились как с числами 
^ одинарной длины (4 байта), 
так и при двойной длине слова 
(8 байтов). 

Во всех используемых 
далее квадратичных « алгорит- 
мах минимизации функций 
многих переменных принят 
следующий (относительный) 
критерий окончания реше- 
ния: порядок отношения 

норм градиентов в конечной 
и начальной точках меньше некоторого заданного (отрицатель- 
ного) числа е. Если 'же в процессе решения задачи требуемой 
точности достигнуть не удается, то окончание работы алго- 
ритма минимизации определяется наперед заданной близостью 
точек минимума, найденных при линейном «спуске» вдоль каждого 
из двух последовательных направлений движения. 

Среди выбранных тестовых примеров содержатся менее трудные 
(задачи 1, 7, 13, 16, 18) и более трудные (задачи 12, 14, 15, 17, 
19) для минимизации функции. Результаты решения тестовых задач 
с применением различных (квадратичных) алгоритмов минимизации 
даны в табл. 8 — 18; параметр е в критерии окончания работы алго- 
ритма принят равным — 7 всюду, где это специально не указывается; 
результаты для 55ѴМ, полученные при использовании другого ва- 
рианта одномерного поиска, обсуждавшегося ранее в этом разделе, 
приведены в фигурных скобках; результаты с одинарной точностью 
даны в круглых скобках. 

В таблице 19 и на рис. 13 приведены результаты решения тесто- 
вых задач 2 — 6, 8 — 10, 20 с увеличением размерности п от 10 до 
200 (каждый результат представлен четверкой чисел — К /, К р , /*, 
\§*\- 

Решение выполнялось методом с одинарной точностью. С ро- 
стом п вычислительные затраты К / увеличиваются, но не быстрее, 
чем при прямой пропорциональной зависимости. 
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ГЛАВА IV 

Оптимизация 
химико-технологических 
процессов при наличии 
ограничений 


Характеристика ограничений в задачах 
оптимизации 


Задача оптимизации химико-технологических процессов по существу 
сводится к нахождению некоторого компромисса между выбором 
определенных условий проведения процесса (характер цели) и огра- 
ниченностью ресурсов (средства достижения цели). Характер ком- 
промисса, принятого при решении конкретной задачи, сказывается 
на форме критерия оптимизации и в большинстве случаев предпола- 
гает наличие явного указания на ограниченность ресурсов опреде- 
ленного вида, например, расходов сырья. Кроме того, при проведе- 
нии конкретного химико-технологического процесса обычно должны 
быть 'выдержаны определенные условия, т. е. ограничения, налага- 
емые ’на 'значения его параметров; эти ограничения связаны с харак- 
тером принятой технологии и т. п. Ограничения, встречающиеся 
в задачах оптимизации химико-технологических процессов, можно 
подразделить на две группы. 

К первой группе отнесем те, которые налагаются на за- 
висимые переменные системы. К ним относятся выходные и промежу- 
точные переменные системы, а также фазовые переменные аппаратов, 
являющихся объектами с распределенными параметрами. Ограниче- 
ния первой группы появляются в случае: 

постановки задачи оптимизации в форме [73, с. 15]: найти ми- 
нимум затрат при заданной производительности целевого продукта, 
найти максимум производительности при заданной себестоимости, 
и т. п.; 

наличия ограничений по качеству выходного продукта, т. е. 
когда Фребуется, чтобы количества непрореагировавших или по- 
бочных |продуктов не превышали заданных величин; 

наличия ограничений на переменные потока внутри аппаратов 
(объекты с распределенными параметрами), например, иногда зада- 
ется ограничение на температуру реакционной смеси в каталитиче- 
ском реакторе. Можно привести и другие ограничения, относящиеся 
к первой группе. 

Ко второй группе отнесем ограничения, налагаемые 
на независимые переменные системы: входные переменные и управ- 
ляющие переменные аппаратов. Их можно подразделить следующим 
образом: 
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ограничения на технологические управляющие переменные, обу- 
словленные возможностями ( в данном случае мощностью) аппаратуры; 
так, величина нагрузки на реактор ограничивается мощностью 
компрессора, температура холодильника реактора — некоторым мак- 
симальным значениям, определяемым конструкцией холодильника, 
температура куба ректификационной колонны — необходимостью 
предотвратить необратимые изменения разделяемой смеси, и т. д.; 

ограничения на конструктивные переменные (например, длина 
трубки, диаметр реактора); 

ограничения, связанные с условиями взрывобезопасности и т. п. 
Рассмотрим обе группы переменных с точки зрения учета их в ме- 
тодах оптимизации, при которых схема рассматривается как единое 
целое. Несмотря на то, что все ограничения можно формально све- 
сти к виду (I, 8), в большинстве случаев они совершенно различны 
по своим свойствам. Остановимся на этом подробнее. Начнем с ме- 
тодов первой группы. Они обладают следующими свойствами: 

явный вид функции ф; [см. выражение (I, 8)] нам неизвестен, 
мы можем только найти ее численное значение, зная управления 
в блоках и рассчитав схему; 

ограничения первой группы являются, по существу, принципиаль- 
но нелинейными, поскольку модели блоков как правило нелинейны; 

ограничения на выходные переменные к - го блока эквивалентны 
наличию ограничений на управления всех блоков, входящих в зону 
воздействия [3, с. 18] на &-тый блок; так, наличие ограничений на 
выходные переменные последнего блока простой последовательности 
блоков (см. рис. 22) эквивалентно наличию ограничений на управ- 
ления всех блоков данной последовательности. 

Таким образом, ограничения первой группы носят глобальный 
характер, связывая воедино переменные многих блоков. 
Рассмотрим теперь свойства ограничений второй группы: 
они носят локальный, поблочный характер поскольку налагаются 
на совокупности управлений, относящихся к отдельным блокам схемы; 
их явный вид известен; 

во многих случаях они линейны и имеют вид либо выражения 
(IV, 98), либо еще более простой [см. неравенство (1,9)]. 

Присутствие ограничений первой группы существенно усложняет 
задачу оптимизации. В этой главе будут рассмотрены методы после- 
довательной безусловной минимизации и методы с непосредственным 
учетом ограничений. Последние представлены методом обобщенного 
приведенного градиента (МОПГ) и рядом методов с линейными ограни- 
чениями. 

Методы последовательной безусловной 
минимизации 

Пусть в п-мерном пространстве переменной х фиксировано мно- 
жество й, на котором определены функция / (х) и отображение к (х) 
в пространство Е т . Задача заключается в определении минимума 
функции 

тіп / (х) (IV, 1) 
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Рис. 14. Геометрическая интерпрета- 
ция задачи с ограничениями. 


при условии 

Л(*)€г <г т (іѵ, 2) 

В большинстве практических 
задач Н ( х ) в условии (IV, 2) 
записывается в виде 

фі (х) = О, 

1=1,..., р (IV, 3) 
%'М^О, і = 1 , . . . , д 

т = р + Я (IV, 4) 

Ограничения типа неравен- 
ства (IV, 4) могут быть фор- 
мально представлены как 
ограничения типа " равен- 
ства (IV, 3), для этого 



вводят соответствующие функции 


Ф і+р (X) = Ь (X) н ('ф^(дг)) =0 / 1 , .... <7 (IV, 5) 

где Я (І) — функция Хевисайда; при I > 0 Я (4) = 1, при I < 
< 0 Я (4) = 0. В дальнейшем мы будем иметь дело только с этой, 
так называемой, канонической формой [см. выражения (IV, 1), 
(IV, 3), (IV, 5) ] задачи на условный экстремум. 

Пусть решение х* исходной задачи существует. Введем про- 
странство 2 (=Е т + 1 ), содержащее значения функций (/ (х), 
Фі (*), Фр ( х )> Фр+і (х), ф т (*))< которое будем рассматри- 

вать как прямое произведение пространства Е 1 значений функции 
І (х) и пространства ’Р (=Я р +«) значений функций <р ь і = \, ... 
..., т, определяющих ограничения (IV, 3), (IV, 5). Пространство 2 
использовалось для решения различных экстремальных задач [74, 
75]. Элементы г ^ 2 имеют вид: г = (/, <р), где / — число, а ф ^ Ч* 1 . 
Обозначим через 0 2 = (0, (V) нулевой элемент пространства 2, 
а через е = (1, 0,р) — единичный вектор в направлении оси О/. 
Введем множество 

Л = {г | г^г, г = г (х), й} (IV, 6) 

где г (х) = [/ (х), ф (х) ]. Элемент г (х) является образом элемента х 
в пространстве 2, а множество Л — образом множества й (рис. 14). 
Заметим, что обратное отображение, переводящее множество А в О 
в общем случае не является однозначным. 

Выберем в пространстве переменной х элемент х ^ й, удовлет- 
воряющий ограничениям (IV, 3), (IV, 5), т. е. такой, что ф (х) = (V. 
Образ этого элемента г (х) — [/ (х), ОчП в пространстве 2 является 
точкой оси О/. Отсюда ясно, что образом множества точек х Й, 
которые удовлетворяют ограничениям (IV, 3), (IV, 5) задачи, явля- 
ется пересечение множества Л с осью О/, а образ г* = г (х*) = 
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= [/ (л:*), ф (л:*) ] оптимальной точки х*, т. е. решения задачи (IV, 1), 
(IV, 3), (IV, 4), является «нижней» точкой этого пересечения, т. е. 
точкой (/, ф) множества Л П О/, имеющей наименьшее значение 
компоненты /. Очевидно, что точка г ( х *) лежит на границе множе- 
ства Л. В противном случае (если бы она являлась внутренней точ- 
кой Л) можно было бы указать элемент множеста Л, расположенный 
на оси О/ «ниже» точки г (х*), что противоречит предположению 
об оптимальности х*. 

Установленный таким образом факт, что точка г (х*) является 
крайней точкой пересечения оси О/ с множеством Л, позволяет сфор- 
мулировать для ее определения некоторые задачи оптимизации в про- 
странстве 2 значений функций критерия и ограничений. Методы 
решения этих задач составляют суть так называемой, последователь- 
ной безусловной минимизации. 

Метод множителей Лагранжа 

Рассмотрим задачу минимизации (IV, 1) при ограничениях типа 
(IV, 3), полагая П = Е п . Пусть множество Л является замкнутым 
и выпуклым. Введем функцию Лагранжа 

Ф (х, К) = / (х) (х) (IV, 7) 

где к — совокупность множителей Лагранжа. В пространстве 2 
правая часть выражения (IV, 7) определяет линейный функцио- 
нал 7, : 7.2 = / — Я, т ф, причем Ьё = 1 > 0. Множество 

Ьг = с (IV, 8) 

в пространстве 2 — представляет собой плоскость, которая пере- 
секает ось О/ в точке с ординатой, равной величине с (рис. 15). 
Если в семействе определяемых функционалом 7, параллельных пло- 
скостей, пересекающих множество А, выбрать плоскость, облада- 
ющую самой «низкой» точкой пересечения с осью О/, т. е. если зна- 
чение с в равенстве (IV, 8) при- 
нять равным 

с' = ШІП І 2 (IV, 9) 

г €л 

то равенство (IV, 8) определяет, 
так называемую опорную пло- 
скость к множеству Л (напомним, 
что плоскость называется опорной 
к Л в некоторой его точке, если 
множество Л целиком лежит по 
одну сторону этой плоскости). 
Находим 

с' = тіп г* — / (х*) (IV, 10) 

Рис. 15. Геометрическая интерпретация ме- 
тода множителей Лагранжа. 



/Гх=ь*2* 
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т. е. точка пересечения любой опорной плоскости, описываемой урав- 
нением (IV, 8) (в котором с = с'), с осью О/ расположена во всяком 
случае не «выше» точки 2 *. Другими словами, величины с' являются 
оценками / (х*) снизу, причем их можно использовать для нахожде- 
ния точки г* = 2 (х*), а следовательно, и решения х* исходной за- 
дачи. 

Если — оо < с < / ( х *) (сё Ф Л), то в силу теоремы об отдели- 
мости [76, с. 42] существует (ненулевой) линейный функционал X, 
такой что 

І(се)<тіпІг (IV, 11) 

2 Л 

При этом Ьё — А 0 , ?. 0 Ф 0, так как в противном случае Ь (сё) = 
= с-Ьё = 0 и Хг* = Г [/ (х*) ё] = / (х*) Ьё = 0, т. е. точки (с, (V) 
и г* ( Л не разделяются функционалом X, что противоречит не- 
равенству (IV, 11). Не ограничивая общности, можно принять, что 
в неравенстве (IV, 11) К 0 = 1, т. е. что функционал X имеет вид 
Ьг = і— Х т ф. Соотношение (IV, 11) означает, что точка (с, 0<р) 
пересечения опорной к Л плоскости, определяемой функционалом 
Ь, с осью О/ лежит «выше» точки (с, Очг): 

Ь (се) = с < с = тіп 7г^/ (х*) (IV, 12) 

г € Л 

В то же время, так как г* не является внутренней точкой Л, сущест- 
вует опорная к Л плоскость [76, с. 41 ], проходящая через г*, 
т. е. существует ненулевой линейный функционал Ь* над 2, такой, 
что 

І*г* = тіп 7*г (IV, 13) 

г €: Л 

Если предполагать, что х* является регулярной точкой отоб- 
ражения ср: Е п -»■ Е р , определяемого функциями левой части 
равенства (IV, 3), т. е. линейный оператор дф (х*)/дх отображает Е п 
на все пространство Е р или, что то же, векторы 

дфі (**) дф р (х*) 

дх > • • • > д х 

линейно независимы, то Ь*ё Ф 0. Действительно, если Ь*ё = Ь 0 — 0, 
то необходимое условие минимума функционала Ь*г на множестве Л 
[для левой части выражения (IV, 13)] или, что то же, минимума 
Ь*г (х) [Ь*г (х) = Я 0 / (х) — 7 т ф (х) ] для х ^ Е": 

Л ді(х*) (ду(х*)у п 

дх V йх ) Я = 0 ( ІѴ - 14 ) 

вместе с условием регулярности дает К = 0, т. е. функционал Ь * 
оказывается нулевым. Полученное противоречие показывает, что 
в выражении (IV, 13), не ограничивая общности, можно принять 
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Я 0 = 1 и, следовательно, функционал Ь*г взять в виде: Ь*г = / — 
— Я т ф. Отсюда следует, что 

Ь*г* = тах с' ■= шах тіп и = шах тіп Ф ( х , X) (О :-== Е п ) 

^ ^ 2$Л ^ й 

Т. 6. 

/ (х*) = Ф (х*, X*) = шах шіп Ф (х, X) (IV, 15) 

Заметим, что поскольку в предшествующем изложении речь 
шла о построении опорных плоскостей, минимум 

шіп Ф ( х , X) 

X ^ й 

в выражении (IV, 15) следует понимать как глобальный 
минимум функции Ф (л:. Я) на множестве й при фиксированном 
векторе Я ^ Е р . Из рис. 15 ясно, что операция взятия максимума 
по Я в выражении (IV, 15) также представляет глобальный 
максимум по Я. Это легко показать и аналитически. Действи- 
тельно, пусть х (Я) й является трчкой глобального минимума 
Ф (х. Я), т. е. 

Ф [х (X), Л] =*» шіп Ф (х, X) 

х ^ й 

Тогда для любого Я 

Ф[х(Я), А]^Ф(х*, X) (IV, 16) 

Так как ф (х*) = 0, из формулы (IV, 7), находим 

Ф(х*, А)з=Ф(х*, X*) (IV, 17) 

Следовательно 

Ф[*(Я), Я]^Ф(х*, /.“) .. Ф [.ѵ (/.*). ?.*] (IV, 18) 

т. е. Я* является точкой глобального максимума функции Ф (х, (Я), Я), 
что и выражает соотношение (IV, 15), которое можно записать в виде 

Ф (х*, X*) *= шах Ф [х (X), X] (IV, 19) 

X 

В соотношении (IV, 15), как в частном случае, находит свое выраже- 
ние общий принцип построения рассматриваемых в данном параграфе 
методов решения задач с ограничениями. Он предусматривает орга- 
низацию двухуровневого вычислительного процесса, верхний уровень 
которого представляет собой итерационную процедуру относи- 
тельно некоторой совокупности искусственно введенных параметров: 
в выражении (IV, 15) — это поиск максимума функции Ф [х (Я), Я)] 
относительно множителей Лагранжа Я, а нижний — итерационную 
процедуру в пространстве независимых переменных х исходной 
задачи с ограничениями. Эта процедура выполняется при фикси- 
рованных значениях «искусственных» параметров верхнего уровня: 
в выражении (IV, 15) — это минимизация по переменным х ^ ^ 
функции Лагранжа (IV, 17) при фиксированных Я. В основном нам 
придется иметь дело со специальным типом двухуровневого про- 
цесса, аналогичным описываемому выражением (IV, 15), в котором 
процедура верхнего уровня представляет собой поиск максимума 
некоторой функции по известным параметрам, а процедура ниж- 
него уровня — поиск ее минимума по переменным х. 

ПО 


Рассмотрим более подробно верхний уровень процесса (IV, 15), 
т. е. выражение (IV, 19). В дополнение к ситуации, изображенной 
на рис. 15, в соответствии с которой функция (IV, 17) имеет ми- 
нимум на множестве О = Е п в некоторой точке х (А), будем пред- 
полагать выполненным достаточное условие минимума 
функции Ф (х, А,) в точке х (А): 

г т Ѵ [х (X), А] г > 0 , (IV, 20) 

где г ^ Е п , г Ф 0, а 

есть матрица вторых производных функции Ф (х, А) в точке х (А). 
[Для выполнения условия (IV, 20) достаточно потребовать его 
выполнения в точке х* = х (А*) и непрерывности вторых производ- 
ных д 2 Ф /дх і дх і . ] 

Вычислим первые и вторые производные функции Ф (А) = 
= Ф [х (А), А]. Находим 


РФ / дх у рф рф 
~дГ " \~РГ ) ~дхГ + ~Ж 


(IV, 21) 


Но в точке х (А) минимума Ф (х, А) частная производная дФ/дх 
равна нулю. Учитывая равенство (IV, 7), получаем дФ/дк = — ср (х) и, 
следовательно 

РФ 

= — ф [х (А)] (IV, 22) 


Последующее дифференцирование этого соотношения по А дает 


ѵІ ф =* 


Рф дх 
дх РА 


(IV, 23) 


Производные 
РФ [х (А), А] 
дх 


дх/дк можно вычислить с помощью 
0. Дифференцируя его, находим: 


Отсюда получаем 


— ( 

' РФ 

Н(А), А] ' 

ІІ 

< 

ю 

ѳ 

дх . 1 
■рАГ + 1 

' д ( 

' РФ \1 

РА \ 


дх 

_ дх ' 

ч РА Л 



-ѵ 2 ,ф 

дх ! 

рф \ т 

= 0 




РА V 

дх ) 



дх 

~д Г 


-('««-п-ё-) 


тождества 


(IV, 24) 
(IV, 25) 


(Обратная матрица существует, так как согласно неравенству 
(IV, 20) А1Ф = V положительно определена.) Совместное рассмотре- 
ние выражений (IV, 25) и (IV, 23) дает 


ѴІФ 


где 


Рф [х (А)] 

дх 


Ѵ* ф I х (А), А]}" 1 ( дЦ>[ д х т ) Т = -І/У-ДУ Т (IV, 26) 


V = 


Рф [х (А)] 
дх 


Ш 


Соотношение (IV, 22) показывает, что в точке А = А* функция 
Ф [х (А), X] действительно имеет экстремум: 

ЭФ (А,*) 

— — = -ф [X (Я*)] *= -ф {х* ) т О 

согласно соотношению (IV, 19) — это максимум, а из соотношения 
(IV, 26) следует, что матрица вторых производных функций 
Ф іх (А,), А,] отрицательно определена, так как {у|Ф [х (А), А,]) -1 — 
положительно определена и векторы градиентов д(р ( /дх при 
і = 1, ..., р линейно независимы (точка х (А) — регулярная). Это 
последнее обстоятельство позволяет применить метод Ньютона 
на верхнем уровне, соответствующем операции поиска максимума 
функции Ф [х (к), А] в выражении (IV, 15): 

х і + 1 = % і - [ѵ^Ф (А,-)] -1 д ^ і) *= А,- - ОУУ-'бЛ)- 1 ф [Л- (А,.)] (IV, 27) 

который, как известно, обладает квадратичной скоростью сходимости 
в окрестности к*. Строго гЪворя, для применения выражения (IV, 27), 
необходим расчет элементов матрицы V [х (А), А], т. е. вторых про- 
изводных (по х) функции Ф (х, А) в точке х (А), обычно требующий 
значительного объема вычислений. Однако если на нижнем уровне, 
соответствующем операции поиска минимума Ф (х, А) по перемен- 
ным х в выражении (IV, 15), минимизация выполняется с примене- 
нием одного из алгоритмов квазиньютоновского типа с аппроксима- 
цией обратного гессиана, то в точке минимума х (А) оказывается 
известной достаточно хорошая оценка для матрицы У -1 , которая 
и может быть использована в выражении (IV, 27). 

Таким образом, с учетом принятых в этом разделе допущений, 
метод множителей Лагранжа может быть представлен в форме ал- 
горитма, состоящего из следующих шагов. 

Алгоритм III. 

1. Даны х 0 С Е п , А 0 С Е р , е > 0. Положить к = 0. 

2. Найти точку х к+1 минимума функции (IV, 7) Ф (х, к к ). 

3. Вычислить «новые» значения А а+1 множителей Лагранжа по 
формуле (IV, 27). 

4. Если 

дФ (х к+1 . А й+ і) . 

Тх ^= 8 

то остановиться (х к+1 — оптимальная точка); в противном случае 
положить к = к + 1 и перейти к шагу 2. 

Сделаем несколько замечаний к приведенному алгоритму. 

Шаг 2 представляет собой вычислительную процедуру нижнего 
уровня — алгоритм безусловной минимизации функции Ф (х, к к ). 
Соответствующие методы (первого порядка), обладающие свойством 
квадратичного завершения (в том числе квазиньютоновские), под- 
робно описаны в главе III. В качестве начального приближения 
к х А+1 здесь и далее принимается точка х к . Условие окончания работы 
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алгоритмов этого типа основано на оценке градиента минимизируе- 
мой функции, которая в данном случае имеет вид 

I (ЭФ (*й+ь X к ) I ^ 


с некоторым е х > 0. 

На шаге 4 выполняется анализ условия остановки алгоритма. 
Его выполнение означает, что в начальной точке х к+1 , предназна- 
ченной для последующего выполнения шага 2 с «новыми» значени- 
ями X, уже выполнено (при е = условие окончания шага 2, 
т. е. условие окончания работы алгоритма безусловной минимиза- 
ции, и основной алгоритм должен быть остановлен. Нетрудно уста- 
новить связь между условием шага 4 и более «естественными» усло- 
виями остановки метода множителей: | Х к+1 — Х к | < е 2 с некото- 
рым е 3 > 0 или 

ЗФ[*(Ьк), Х к ] _ 

Щ <ез 


с некоторым е 3 > 0. В самом деле, выражения (IV, 7), (IV, 27) 
и (IV, 22) дают: 


дФ(*ь+і. Х к+х ) 

д[ (х к+1 ) 

( дц,(х к+1 ) у 

(ЭФ (х к+1 , Х к ) 

дх 

дх 

V дх ) /й+1 

дх 


- №... - »»> - дФ ^ *»> + (кѵ-<л)-’ ф <аді - 


! 


дФ[х(А&), Аь] 
дх 


и 1 (і иѵ -‘у 7 )- 1 


<ЭФ[х(Ай), Ай] 
дХ 


(IV, 28) 


Это позволяет перейти от одной формы условия остановки к другой 
ввиду линейной независимости векторов дуі/дх. Обычно условие 
шага 4 усиливается требованием достаточной близости точек х к+1 
и х к и (или) другими условиями. 

В заключение сделаем два замечания. Первое касается принятого 
здесь предположения о выпуклости множества Л. Оно является 
существенным. Действительно, при наличии в окрестности решения 
так называемого «зазора» между Л и его выпуклой оболочкой (см. 
рис. 14), приведенный выше алгоритм, определяющий шах шіп 

X х 

Ф (х, X), даст в качестве решения точки х, которым в про- 

странстве 2 соответствуют точки 1 или 2 [<р (х) Ф 0], в то время 
как действительному решению соответствует точка г*. Снять требо- 
вание выпуклости множества Л удается при использовании, так 
называемой «модифицированной» функции Лагранжа, к рассмотре- 
нию которой мы обратимся в конце этого раздела. Второе замечание 
связано с выполнением некоторой процедуры минимизации функции 
Ф (х, Х к ) на шаге 2 алгоритма метода множителей. Применяемые для 
этой цели алгоритмы носят, как правило, локальный характер. 
В этой ситуации метод множителей может привести к локаль- 
ному решению х* ^ Е п исходной задачи, либо вовсе не дать 
решения. 


ПЗ 


Метод ,, уровней “ 


Рассмотрим общую задачу минимизации (IV, 1), (IV, 3), (IV, 5), 
предполагая множество Л лишь замкнутым (выпуклость' Л необя- 
зательна). 

Как и в предыдущем случае, изложение будем вести с при- 
влечением двойственных переменных — функционалов над I. 

Пусть оо < р <С р* = / (х*). Возьмем однопараметрическое 
(зависящее от параметра р) семейство определенных на А функций 

Кц ( г ) 

Кц(г) = \г~ рё|, (IV, 29) 

определяющих расстояние от точки г ^ А до точки рё ^ Л. 

Обозначим через ^ (ЯЦ > 0) расстояние от точки рё до мно- 
жества Л: 

ІПІ | г рё |, (IV, 30) 

*€ Л 

Поскольку Л — замкнуто, существует 2 Л А [149, с. 22], для 
которого достигается нижняя грань в (IV, 30), т. е. функция (IV, 29) 
достигает в точке 2,1 = (/Ц, срЛ) своего наименьшего значения: 

% ~ Кц ( г *ц) = I г Л — рё | щ шіп I г — рё I > 0 (IV, 31) 

г^Л 

Теперь можно улучшить нижнюю оценку р величины / (х*) 
положив 

I 1 ' (Ч) =~- 1 1 + Ч (IV, 32) 

Действительно, в силу равенства (IV, 30) можно записать: 

р<р' = р + Д*^р + (р*_ р) = р* (IV, 33) 

Таким образом, соответствующий двухуровневый вычислитель- 
ный процесс для метода «уровней» (см. предыдущий метод) включает 
определение точной верхней грани, т. е. зир р' (#Ц) при р' (/?*) 

из формулы (IV, 32), на вер хнем уровне и минимизацию функции 
(IV, 29) — определение — на нижнем уровне. 

Если Л выпукло, то по заданной величине р можно получить 
лучшую, чем р' оценку 

, (*д) 2 

р^ + 7 ___ >И( (ІѴ , 34) 

которая определяется как асбцисса точки пересечения с О/ опор- 
ной к Л плоскости, проходящей через точку гД 

В некоторых случаях эту оценку можно получить и при более 
слабых предположениях, что показано на рис. 14; точка р"ё [р" 
соответствует формуле (IV, 34) ] лежит на пересечении оси О/ с пло- 
скостью, определяемой некоторым линейным функционалом Ь, 
касательной к Л в точке гД. Точка р'ё [р' соответствует формуле 
(IV, 32) ] лежит на пересечении О/ со сферой (радиус центр 
в точке ре), соприкасающейся с границей множества Л в точке гД. 
Видно, что точка р"е лежит «выше» точки рё и одновременно «ниже» 
точки г ( х *). 
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Обычно вместо функции (IV, 29) рассматривают ее квадрат 
р и (*) = к І г (■*)] = I/ (*) - Ц] 2 + Ф 2 (л) (IV, 35) 

и вводят положительные коэффициенты при члене ф 2 : 

Р я 

р ц, а (*) * I/ (*) ~ Ц] 2 + 2 а ( ер 2 (х) + 2 р ; .ф 2 (х) я до (л)] (І у, 36) 
і=і /= 1 

а =(“. Р) а і > 0 г=1,..., р ру > 0 / = 1, .... 9 

Подобная функция рассматривалась в работе [77 ]; там же предло- 
жен один из алгоритмов определения последовательных значений 
параметра р. 

Если а' т Ко, К > 1, то находим 


|х, а' 


= тіп Р 


, о' (*) — Рц, а' ( Х І1, а') 


ц, о 


(IV, 37) 


* $ й 

> р ц,о( х 1,о')>т‘п Р^, а ( х ) 

Отсюда следует, в частности, что использование а* > 1 при 
і — р; Ру > 1 ; / = 1, ..., ц в выражении (IV, 36) позволяет 

получить лучшую оценку р/ в формуле (IV, 32). Кроме того, при 
получении очередного значения р/ нижней оценки / (**) целесооб- 
разно одновременно увеличивать коэффициенты а и Ру. Это ясно 
и геометрически из графика (рис. 16), на котором показана сфера 
(радиус Е й , центр в точке рё), соприкасающаяся с границей мно- 
жества Л и представляющая собой поверхность уровня функции 
(IV, 36) при а $ Щ ру « 1, обладающую минимальным в силу равен- 
ства (IV, 31) значением — уровня на множестве Л. Точка р'ё 
лежит на пересечении сферы с осью О/. Пунктиром показан соприка- 
сающийся с границей множества Л эллипсоид, который представляет 
собой поверхность уровня функции (IV, 36) при а > 1, обладающую 
минимальным значением уровня ЕЦ а на множестве Л. Эллипсоид 
вытянут вдоль оси О/. «Верхняя»’ 
точка его пересечения с осью распо- 
ложена «выше» точки р'ё, так как 
в противном случае эллипсоид цели- 
ком располагался бы внутри сопри- 
касающейся сферы (за исключением, 
быть может, своих крайних точек 
на оси О/), вследствие чего не 
обладал бы общей точкой с множе- 
ством А, т. е. не являлся бы «сопри- 
касающимся» эллипсоидом. 

Приведенные в этом пункте ре- 
зультаты можно представить в виде 
алгоритма, состоящего из следующих 
шагов. 

й=5Г 



і,в>і 


Рис. 16. Геометрическая интерпретация метода 
уровней. 
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Алгоритм IV. 

1. Даны х 0 ^ Е п , р 0 < ц*, ст 0 = (а 0 , |3 0 ) [см. формулу (IV, 36)], 
е > 0. Положить к = 0. 

2. Найти точку х к+х минимума функции Р» а (х) [см. формулу 

(IV, 36)]. к к 

3. Вычислить «следующее» значение параметра р [см. выражения 
(IV, 32), (IV, 35) ]: 

^й+1 = Ѵ-к "Ь Чк ( Л й+і) 


и штрафные коэффициенты а к+1 = Ко к , о к+1 < сг шах (обычно при- 
нимают К, = 10). 

4. Если р й+1 — рь < е, то остановиться (х к+х — оптимальная 
точка); в противном случае положить к = к + 1 и перейти к шагу 2. 

На шаге 1 приведенного алгоритма начальные значения параметра 
р и штрафных коэффициентов а = (а, Р) обычно выбираются на основе 
имеющейся предварительной информации о данной задаче. Часто 
оказывается известной нижняя оценка значений критерия оптимиза- 
ции, позволяющая правильно выбрать р 0 , не занижая его слишком 
сильно. Характер ограничений, их влияние на поведение модели и 
требуемая точность выполнения обычно позволяют выбрать подходя- 
щие значения для штрафных коэффициентов о> 0 . Формула для изме- 
нения параметра р на шаге 3 была предложена в работе [74]. При 
этом минимум функции Рц к ' а к (х) должен быть найден с высокой 
точностью, иначе для некоторого значения к может оказаться, что 
Ш+і > р , т. е. рь +1 уже не будет являться нижней оценкой / (х*), 
и последующее многократное применение формулы шага 3 при про- 
должении работы алгоритма даст либо возрастающую последователь- 
ность значений р, либо приведет к окончанию работы при значении 
критерия >/ (х*). Версия этого алгоритма, предусматривающая 
нахождение верхних оценок для р, в которой наряду с формулой 
(IV, 32) используют и оценку (IV, 34), предложена в работе [78], 
см. также [11, с. 157]. 

Используемое на шаге 4 условие остановки алгоритма по существу 
является оценкой величины о к {х к -\-\), в которую входят 

[см. функцию (IV, 36)] отличающиеся одна от другой по своему 
характеру функции: критерий оптимизации и разного рода ограни- 
чения. Применение одной лишь этой оценки обычно сопровождается 
повышенными требованиями к точности расчета, так как выбор зна- 
чения е > 0 зависит от одного или нескольких жестко заданных огра- 
ничений или (и) требуемой точности определения оптимального 
значения критерия. Поэтому условие остановки алгоритма целесо- 
образно применять в следующей форме: 


/ ( Х к+1-І) ( х к) 
/ (Хк) 


<6і 


ИЛИ 


I / (Хк+ 1) — / (Хк) I < еі 


в !>0 


| ( х к+і) I < % %>° ( = 1,..., р (IV, 38) 

ф /+р (*А+і) < % %• > °’ / = 1 Я 


I х к +і — х к | < е 4 
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г 4 >0 


Метод ,, штрафов 1 1 

Если метод множителей Лагранжа можно трактовать геометрически 
как метод касательных (к границе Л) плоскостей, а метод «уровней» — 
как метод соприкасающихся сфер (или эллипсоидов), то традицион- 
ный метод штрафных функций можно назвать методом соприкасаю- 
щихся параболоидов. В этом методе решения задачи (IV, 1), (IV, 3), 
(IV, 5) рассматривается следующее однопараметрическое семейство 
определенных на Л функций: 

$р(г)=/ + Рф 2 (IV, 39) 

Поверхности уровня этих функций (в пространстве 7.) 

5р{г)=с (IV, 40) 

представляют собой параболоиды. При с = ѵ, где 

ѵ = тіп 5р (г) (IV, 41) 

г ^ Л 

формула (IV, 40) определяет параболоид, соприкасающийся с грани- 
цей множества Л (рис. 17). Пересечение соприкасающегося парабо- 
лоида с осью О/ определяется точкой ѵё, причем 

ѵ = тіп 5р (г) ^ 5р [г (х*)] = / (х*) (IV, 42) 

г (; Л 

Если в выражении (IV, 42) ѵ < / (х*), то можно улучшить нижнюю 
оценку ѵ для / (х*), увеличив р. Действительно, если Р' > Р, у пара- 
болоида 

/ + Р'Ф* = ѵ (IV, 43) 

(вершина в точке ѵё) нет общих точек с множеством Л, так как в про- 
тивном случае [г — (/, ф) (Ли удовлетворяет уравнению (IV, 43) ] 
имело бы место равенство 

5р (г) = 1 + РФ а = I + Р'ф 2 — (Р' — Р) Ф 2 = ѵ — (Р' — Р) Ф 2 = 

= тіп $р (г) — (Р' — Р) ф 2 < тіп 5р (г) 
г 6 Л 2 ^ Л 

что противоречит формуле (IV, 41). Тогда, принимая во внимание, что 

(г) > 5 р (г) (IV, 44) 

получаем 

тіп $ р , (г) = $р, (г^,) > тіп 5 р (г) (IV, 45) 

гбл г^л 

т. е. 

ѵ < тіп $р, (г) = ѵ' [ ( х *) (IV, 46) 

г ^ л 

Таким образом, двухуровневая вычислительная схема для метода 
штрафов предусматривает нахождение точной верхней грани 
зир ѵ' [5р- (г) ] на верхнем уровне и — минимизацию штраф- 
|і' С ч т 

ной функции (IV, 39) на нижнем. 
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Рис. 17. Геометрическая интерпретация метода штрафов. 

Рис. 18. Геометрическая интерпретация метода штрафов при /, неограниченной снизу. 

/тл7 В от аЗВерНуТОМ Виде ( в п Р° ст Ранстве переменной х) функция 
(IV, 39) выглядит следующим образом: 

( х ) = 5 |3 I 2 (*)]**/ (х) + 2 “Л? (*) + 

І — 1 
Я 

+ 2 (*) н [■ф/ (*)] р = (а,-, Ру) (IV, 47) 

Приведем алгоритм метода штрафов. 

Алгоритм V. 

1. Даны х 0 6 Я", р 0 а Е т , е > 0. Положить к щ 0. 

2. Найти точку х й+1 минимума (х) функции (IV, 47). 

3. Увеличить штрафные коэффициенты: р й+1 = Кр ь (обычно 

А = 10). 

4. Если | х к+1 х к | < е, то остановиться (х /і+1 — оптимальная 
точка), в противном случае положить к — к + 1 и перейти к шагу 2. 

Условие остановки алгоритма (шаг 4) может быть дополнено или 
заменено условием (IV, 38). 

Метод штрафов является более универсальным, чем метод множи- 
телей Лагранжа, применение которого возможно лишь при «стесняю- 
щем» условии выпуклости множества Л. В то же время применение 
метода штрафов имеет свои недостатки. Коэффициенты р, в общем 
случае, должны неограниченно возрастать, что приводит к «овраж- 
ному» характеру функции Р$ (х) и, следовательно, существенно 
усложняет выполнение ее минимизации. Кроме того, если множество 
А не является ограниченным, точнее, если [ (х), х ^ П не ограничена 
снизу, то выбор начальных величин р может оказаться проблематич- 
ным: при небольших р может случиться, что 

тіп Рр (*) = — оо, 

X (; Й 
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а при больших — сильно выраженная «овражность» Рр ( х ) может 
оказаться непреодолимой при выполнении минимизации этой функ- 
ции. Подобную ситуацию иллюстрирует график, приведенный на 
рис. 18. От этих недостатков свободен метод уровней, в котором не 
обязателен неограниченный рост коэффициентов в штрафных членах. 

Следует отметить, что составная функция (IV, 36) метода уровней 
выглядит «сложнее»: если в функциях (IV, 7), (IV, 47), используемых 
соответственно в методах множителей Лагранжа и штрафных функ- 
ций, критерий / (х) содержится в «неискаженном» виде, то функция 
(IV, 36) метода уровней нелинейна относительно /. 


Метод, использующий модифицированную 
функцию Лагранжа 

Вернемся к задаче (IV, 1), (IV, 3). Обоснованное применение метода 
множителей Лагранжа возможно лишь при условии выпуклости 
множества А, выполнения которого, в общем случае, трудно ожидать 
и проверка которого при решении реальных задач практически неосу- 
ществима. Здесь будет рассмотрено обобщение метода множителей 
Лагранжа на случай невыпуклого множества А, представляющее 
собой своеобразный синтез этого метода с методом штрафов при конеч- 
ной величине «штрафного» коэффициента [79]. В этом разделе 
по-прежнему будем считать множество А замкнутым, предполагая, 
что в точке х* выполнено условие регулярности отображения ф (х) 
[80, с. 74 — 75]. Более того, будем считать, что границу множества 
А в окрестности точки г (х*) можно аппроксимировать формой: 

/ - / (X*) = дар + ф т Лф (IV, 48) 


обладающей наименьшим собственным значением | т1п матрицы А: 
Ішіп > — 00 • Если ^ т1п > 0, то множество А локально выпукло 
в окрестности 2 *, если же ^ П1ІП < 0, то существует конечное у > 
>|Ітш|. Д ля которого множество А' в пространстве Г является 
локально выпуклым в точке г'* = [/ (х*), 0^] при условии, что 
2' = (Гг ф), ГДе 

Г = / + ѴФ 2 (IV, 49) 


Таким образом, в случае невыпуклого (в точке г*) множества А метод 
множителей Лагранжа может быть применен к функции (IV, 49), 
обладающей конечной величиной у [79]: 


где 


/ (х*) = ф; (х\ X*) = тах тіп Ф; (х, X), (IV, 50) 

Ф; (х, X) = / (х) - Гф (х) + уф 2 (х) (IV, 51) 


есть так называемая, модифицированная функция Лагранжа. В про- 
странстве 1 множество 

Ф' у (х, X) = тіп Ф(, (х, X) (IV, 52) 

X (; И 
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<Рг(-х,Л*)^*Л*) 


Рис. 19. Геометрическая интерпрета- 
ция метода модифицированной функ- 
ции Лагранжа. 


представляет собой сопри - 
касающийся с границей 
множества А параболоид, ось 
которого смещена относи- 
тельно О/. На рис. 19 он 
показан справа. Координаты 
Фг&А^тіпФ^&'Л) точки пересечения оси пара- 
болоида, показанной штрих- 
- пунктирной прямой, с пло- 
к „ г> „„„„ о скостью (0, ф) даны в скоб- 

ках. В средней части рисунка изображен «оптимальный» пара- 
болоид соприкасающийся с множеством А в точке 2 *. Подчеркнем 
что коэффициент у в «штрафном» члене уф 2 выражения (IV 49) — 
конечная величина, в то время как в методе штрафов, в общем слу- 
чае, у —у -роо. ■' 

С учетом выражения (IV, 50) и выпуклости А' о характере двух- 
уровневой вычислительной схемы в методе с модифицированной 
функцией Лагранжа может быть сказано то же самое, что и в методе 
множителей (см. Метод множителей Лагранжа). В частности, может 
быть использована рекуррентная формула (IV, 27) для вычисления 
последовательных значений X. Запишем ее в следующем виде: 



и+1 = іі — (і/Ѵ ’(/ Т ) 1 ф (* і+1 ) = _ 

- \и [V 2 / - Гѵ 2 ф + 2у ( Ф Ѵф + (/Ѵ/)]-і *л}-1 ф {Хі+1 ) = 
где = и - 2у \ц [іг + ищ-' ф (хі+і) 

« 7 =-2^[Ѵ 2 /-(^-2 Ѵ ф) т Ѵ 2 ф] 

Для достаточно больших значении у (у 1) членами 
порядка можно пренебречь. Находим 


(IV, 53) 

(IV, 54) 
второго 


І і+1 « Я; - 2у \Ц (і/ т і/) 1 и г \ 1 ф (* г+1 ) (IV, 55) 

Матрица в фигурных скобках выражения (IV, 55) представляет 
собой проекционный оператор [сравните с формулой (III 38)1 
переводящий векторы из пространства Е р в подпространство, натяну- 
тое на векторы столбцов д^/дх матрицы (Л. Так как, по предполо- 
жению векторы дф і/дх, і = 1, ..., р линейно-независимы, т. е. обра- 
зуют базис в пространстве Е р , упомянутый проекционный оператор 
является тождественным преобразованием Ш ц* = / ] 

пространства Е р в себя и формула (IV, 55) принимает вид: Р 


М+1 = М — 2уф (дгі +1 ) (IV, 56) 

Эта формула, представляющая собой «предельную» (для у 4 * 1) 
форму метода Ньютона для поиска максимума по X функции 
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[л: (Я), Я], находит применение в алгоритме минимизации с моди- 
фицированной функцией Лагранжа. 

Отметим, что эту формулу можно получить с помощью простых, 
но менее строгих соображений. В точке минимума х (Я ; ) модифициро- 
ванной функции Лагранжа Ф(, (х, Я ; ) выполнено необходимое условие 
первого порядка 


д ф П*( Я «). х і ] 

дх 


д[_ 

дх 




ф 


= о 

1 *-=* ( я 0 


(IV, 57) 


Этому условию можно придать вид необходимого условия Лагранжа 
(относительно X) для исходной задачи с соответствующим образом 
подобранными к: 

[*(>■<) Д] ді ( дф у- 

дх дх \ дх ) л 

ді I дер \ т I 

_ ~дх ~ \~дх ) ~ 2 ѴФ)| х=* (Х г ) 

к = Хі — 2уф [х (Я г -)] 


;=л: ал 


(IV, 58) 


и принять эти значения множителей для последующей минимизации 

Фѵ (*. Е). 

При больших значениях штрафного коэффициента у > 1 в точке 
минимума х у (Я) функции Ф(, (х, к) в соответствии с (IV, 57) выполня- 
ется ф (Ху (Я)) 0 (исходя из предположения ограниченности первых 

производных функций / и фг). Таким образом, минимизация функции 
Фѵ (х, Я) при фиксированном значении Я с последующим его измене- 
нием по второй из формул (IV, 58) представляет собой итерационную 
процедуру решения системы приближенных уравнений необходимых 
условий оптимальности (уравнения Лагранжа) 


К 

дх 



Ф (х) х О 


в виде решения системы Р [х (Я) 1 = 0 (первое из необходимых 
условий), в котором х (Я) определяется вторым из необходимых 
условий; изложенный подход полезно сравнить с аналогичной 
процедурой, описанной в работе [3, с. 92 — 93]. 

Сформулируем алгоритм минимизации для метода с модифициро- 
ванной функцией Лагранжа. 

Алгоритм VI. 

1. Даны х 0 С Е п , к 0 ^ Ер, у о >0, Ушах >Уо. е >0- Положить &=0. 

2. Найти точку х к+1 минимума функции Ф(, й (х, к к ). 

3. Вычислить «новые» значения к к+1 множителей Лагранжа по 
формуле (IV, 56) или (IV, 27) и величины штрафных коэффициентов 

Уй+1 ЕУк+1 {К > 1), Ук +1 < Углах- 

4. Если | дФѵ й+1 (*а+і> ^ь+і)/д*| < е, то остановиться (х к+1 — 
оптимальная точка), в противном случае положить к = к + 1 и 
перейти к шагу 2. Шаг 4 в этом алгоритме аналогичен шагу 4 алго- 
ритма III. Подход, примененный в этом разделе, можно использо- 
вать в задачах многокритериальной оптимизации (приложение 1). 
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Совместное применение методов условной 
минимизации и квазиньютоновских методов 
безусловной минимизации 

Рассмотрим теоретически некоторые особенности совместного приме- 
нения методов уровней и штрафов и квадратичных методов безуслов- 
ной минимизации, ориентируясь на эффективность алгоритма опти- 
мизации в целом. Результаты такого рассмотрения могут оказаться 
полезными при анализе практического применения этих алгоритмов 
в каждом конкретном случае. 

Предположим, что рассматриваемая задача содержит ограничения 
лишь в форме равенств. Обратимся к методу уровней. В этом случае 
минимизируемая функция имеет вид (IV, 36) с = 0, / = 1, ..., ц. 

Вычислим матрицу вторых производных этой функции 

а (*) =* и (х) - Р] ѵ 2 / (х) + ѵ/ (х) [V/ (х)] т + 

Р 

+ 2 а і іфі- (X) Ѵ 2 ф г - (х) + Ѵфі (х) [Ѵфі (*)] т } 

1 = 1 

Если х* — решение исходной задачи, то при р Щ и* [/ (х*) ] учиты- 
вая, что фг (х*) = 0; і = 1, р, находим 

Ѵ * Ѵ.а ^*) = Ѵ / (*) [V/ ( х)Ѵ + 2 а,Ѵф, (X) [Ѵф ( . (х)] т \ х=х , 

1 = 1 

Матрицы, входящие в правую часть этой формулы, имеют одина- 
ковую форму представления: они получены в результате умножения 
вектора на свой транспонированный вектор. Ранг подобных матриц, 
очевидно, равен единице. Так как ранг суммы матриц не превосходит 
суммы рангов ее составляющих, то при р < п — 1 ранг матрицы 
( х *) оказывается меньшим п, т. е. она является вырожден- 
ной. Если на нижнем уровне для минимизации функции Р а а (х) 
применяется метод Ньютона [см. выражение (I, 43)], то в общем 
случае эффективность его для рассматриваемой ситуации значительно 
снижается [81, с. 79 86]: вместо квадратичной скорости сходимости 
можно гарантировать лишь линейную скорость, характерную для 
обычного градиентного метода. Следовательно в целом эффективность 
алгоритма метода уровней, используемого совместно с методом 
Ньютона для выполнения безусловной минимизации, должна сни- 
жаться по мере приближения значения параметра р. к р*. Отсюда 
следует также, что в общем случае метод уровней целесообразно 
применять лишь для локализации решения задачи на условный 
экстремум, в частности задавать начальные приближения для х 
и р, достаточно близкие к х 4 ' , р*, нецелесообразно. Последний из 
упомянутых моментов часто проявлялся при расчетах на ЭВМ 
с использованием на нижнем уровне других квадратичных методов 
безусловной минимизации. 

Проанализируем теперь алгоритм метода штрафов. Характерной 
особенностью этого метода является неограниченный рост штрафных 
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коэффициентов а и I = 1, р , в выражении для функции (IV, 47) 
(при ограничениях типа равенства = 0, / = 1, <?). Обозначим 

• эту функцию Р а ( х ). С практической точки зрения, чтобы получить 
достаточно точную оценку для х*. приходится пользоваться довольно 
большими значениями а,-, і = 1, ..., р. При этом Р — константа 
Липшица для матрицы вторых производных функции Р а (х) [при 
условии, что матрицы вторых производных функций / (х) и срі (х), 
1 1> •••> Рі удовлетворяют условию Липшица] увеличивается 

с ростом а;, і = 1. ..., р. Оценки скорости сходимости метода Нью- 
тона, используемого для минимизации функции Р а (х) на нижнем 
уровне, имеют вид [57, с. 71 ]: 

I I Хк+і — х* |г^Яй | хи ““ х* I, 

где х к — х* | 

причем для Р а (х) предполагается выполненным условие сильной 
выпуклости 

тг т г ^ г т Ѵ 2 х Р а (х) г ^ Мг т г М > т > О 

Окрестность х * , в которой сходимость последовательности становится 
сверхлинейной, определяется условием 

4" I ~ I < 1 

(Х й < 1), т. е. размер окрестности г= \х к — х*\ удовлетворяет 
неравенству г < ( тір ). Отсюда, чем больше значение константы 
Липшица Р для ѴІР а (х), т. е. чем больше значения штрафных 
коэффициентов а и і = 1 , р, тем меньше размер окрестности, где 
скорость сходимости последовательности х& к х * становится сверх- 
линейной, т. е. где метод Ньютона обладает высокой эффективностью. 
Таким образом в целом с ростом а іг і — 1, ..., р эффективность метода 
штрафных функций при использовании метода Ньютона на нижнем 
1 уровне снижается. 

I Для преодоления указанных трудностей при решении задач на 
I условный экстремум и уточнения положения экстремума целесо- 
; образно использовать комбинацию методов уровней и штрафов, 

! первый — в начальной фазе оптимизации, второй — в заключитель- 
I ной - 0т этих недостатков свободен метод модифицированной функции 
I Лагранжа, который находит в последнее время все более широкое 
I применение. 

Решение тестовых задач с ограничениями * 

Результаты решения некоторых тестовых задач с ограничениями 
с помощью методов модифицированной функции Лагранжа (АЬ), 

; уровней (ММ) и штрафных функций (РЕЫ) приведены в табл. 20,’ 

- где КІ — число итераций на верхнем уровне, т. е. число изменений 
! параметров составной функции; || ср г || и Цф/Ц — нормы векторов огра- 
ничений типа равенства и неравенства в точке минимума х*; А,„ 

* Раздел написан совместно с Е- Ю. Койранской, 
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55ѴМ 398 135 4 24,3077 — О 0 — 10 - 10 4 



При решении производилась замена переменных: 


(или ц 0 ) начальные значения множителей Лагранжа (параметра и) 
в методе модифицированной функции Лагранжа (или методе уров- 
ней); а 0 , р 0 начальные значения весовых коэффициентов при 
штрафных членах. На нижнем уровне использовались методы безу- 
словной минимизации ЭРР и 55ѴМ (см. гл. III). В методах модифици- 
рованной функции Лагранжа и уровней вместе с изменением множи- 
телей X (параметр ц) увеличивались значения весовых коэффициентов 
при штрафных членах в соответствующих составных функциях 
Коэффициент менялся в пределах от 2 до 10. Значения весовых 
коэффициентов ограничивались сверху значениями а так , р тах . 

Из приведенных в табл. 20 результатов следует, что при прочих 
равных условиях, применение метода модифицированной функции 
Лагранжа оказывается предпочтительным (минимальное значение 
Ау). При заданной точности результата эффективность решения 
конкретной задачи существенным образом зависит от выбора началь- 
ных значений весовых коэффициентов а 0 , р о , коэффициента их измене- 
ния, начальных значений А 0 , ц 0 . 

Характеристика различных подходов 
к оптимизации химико-технологических 
систем * 

В главе II было показано, что в зависимости от того, какие переменные 
в математической модели ХТС принимаются в качестве зависимых и 
независимых, возникают различные постановки задачи оптимизации 
ХТС. Для оценки той или иной постановки задачи удобно пользо- 
ваться следующими пятью характеристиками. 

1 • Характер расчета критерия, он зависит от того, необходима ли 
при заданных значениях независимых переменных итерационная 
процедура при вычислении значения критерия. 

2. Возможность использования алгоритмов условной или безуслов- 
ной минимизации. При прочих равных условиях алгоритмы безуслов- 
ной минимизации существенно более просты. Поэтому преимущество 
имеют те подходы, которые обеспечат решение задачи с использова- 
нием только методов безусловной минимизации. В дальнейшем будем 
предполагать, что в качестве метода условной оптимизации исполь- 
зуется метод штрафов. 

3. Число поисковых переменных. Вообще говоря, с увеличением их 
числа эффективность квазиньютоновских методов падает, 

4. Простота учета ограничений на переменные. Учет ограничений 
типа (I, 9) достаточно прост в рамках любых поисковых методов. 
В то же время учет ограничений типа (I, 10) может оказаться доста- 
точно сложным, требующим трудоемкой процедуры. 

5. Возможность проведения параллельных вычислений. Появление 
многопроцессорных ЭВМ, создание многомашинных комплексов 
в автоматизированных системах управления технологическими про- 
цессами требует разработки таких подходов, которые дали бы воз- 
можность эффективно использовать параллельно работающие про- 
цессоры или ЭВМ. 

* Раздел написан совместно с Н. Н. Зиятдиновым, 
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| Сравним рассматриваемые постановки задач оптимизации, исходя 
из перечисленных пяти характеристик. 

Задача 1. Поиск в пространстве управлений [см. формулы 
(I, 64)— (I, 66)]. 

1. Для замкнутых схем расчет критерия достаточно трудоемок, 
поскольку требует решения системы нелинейных уравнений (I, 65), 
описывающей материальный и тепловой балансы ХТС. 

2. Соотношения (I, 10) учитываются с помощью методов условной 
минимизации. Таким образом, в данном случае процедура оптимиза- 
ции ХТС является трехуровневой (рис. 20): первый соответствует 
решению системы уравнений материального и теплового баланса 
схемы — системы (I, 65) — при фиксированных значениях поисковых 
переменных и, на втором переменные и изменяются в соответ- 
ствии с каким-либо методом безусловной минимизации [возможно, 
учитывающим ограничения (I, 9) ], т р е т и й соответствует измене- 
нию штрафного коэффициента в методе условной минимизации, 
который используется для выполнения ограничений (I, 10). 

3. Число поисковых переменных равно г [см. соотношение 
(1,52)]. 

4. В случае отсутствия ограничений (I, 10) для решения задачи 1 
могут быть использованы методы безусловной минимизации, модифи- 
цированные для учета простейших ограничений (I, 9), и оптимиза- 
ционная процедура будет состоять только из 1-го и 2-го уровней 
(рис. 20). В этом большое преимущество данного метода. Введение же 
ограничений (I, 10) существенно усложняет задачу, поскольку вслед- 
ствие этого придется применять методы условной минимизации 

? (появляется третий уровень в численной процедуре оптимизации). 

5. Распараллеливание вычислений здесь возможно только на 
первом уровне. Система уравнений материального и теплового 
баланса схемы (I, 65) может решаться как последовательно, так и 
параллельно. В случае последовательного решения возможности 

*, параллельного счета очень ограничены. В случае параллельного 
решения системы уравнений (I, 65) можно организовать параллель- 
ный расчет блоков. 

Задача 2. Поиск по некоторым управлениям при выполнении 
| ограничений на выходные переменные при расчете схемы [см. соот- 
ношения (I, 71) — (I, 74)]. В качестве поисковых берут только часть 
управлений, а ограничения на выходные переменные ХТС автомати- 
чески удовлетворяются на каждом шаге оптимизационной процедуры. 
| 1. Расчет критерия более трудоемок чем в задаче 1, поскольку 

требует решения системы уравнений материального и теплового 
балансов совместно с уравнениями ограничений на выходные пере- 
' менные схемы — система (I, 72), (I, 73). 

2. Поскольку соотношения (I, 10) автоматически выполняются на 
і каждом шаге, для решения задачи 2 могут быть использованы методы 
| безусловной минимизации, конечно, модифицированные для учета 
I простейших ограничений (I, 9). В данном случае численная оптими- 
] зационная процедура будет двухуровневой (рис. 21) независимо от 
наличия или отсутствия ограничений (I, 10). 
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Рис* 20. Трехуровневый алгоритм оптимизации ХТС (решение задачи 1). 


Рис. 21. Двухуровневый алгоритм оптимизации ХТС (решение задачи 2). 

3. Число поисковых переменных несколько уменьшается по сра- 
внению с предыдущим случаем. Оно равно г — 5, где 5 определяется 
соотношением (I, 67). 

4. Относительно распараллеливания вычислений здесь может 
быть сказано то же самое, что и в задаче 1 . 

Сравнивая подходы, использованные в задачах 1 и 2, можно от- 
метить преимущество задачи 2, состоящее в том, что в ней использу- 
ется только метод безусловной минимизации. Поэтому, если добавле- 
ние системы (I, 73) к системе (I, 72) ненамного ухудшает скорость 
сходимости численной процедуры решения системы нелинейных урав- 
нений на первом уровне (см. рис. 21), то этот подход может оказаться 
более эффективным. К недостаткам подхода, используемого в задаче 
2, можно отнести следующее. Во время поиска переменные и могут 
принять такие значения, при которых система (I, 72), (I, 73) не будет 
иметь решения. Кроме того, при наличии ограничений на переменные 
и каждый раз когда одна из завйсимых переменных будет выходить на 
ограничение, необходимо изменять совокупности зависимых (и) и 
независимых (и) переменных. 

Задача 3. Поиск в пространстве управлений и всех переменных 
состояния [см. формулы (1,75) — (1,76)]. 

1. Расчет критерия прост, поскольку как мы видели в этом 
случае фактически разрываются все потоки ХТС и на первом уровне 
приходится рассчитывать только левые части системы (I, 72), (I, 73). 

2. Поскольку соотношения (I, 62), (I, 63) трактуются как ограни- 
чения типа равенств, в любом случае надо применять методы услов- 
ной минимизации. Поэтому учет ограничений (I, 10) не меняет харак- 
тера задачи, и сводится к добавлению штрафных членов в штрафной 
функции. 

3. Число поисковых переменных г + т [см. соотношение (I, 52) ] 
намного больше, чем в предыдущих случаях, поскольку как правило 
т » г. 

4. Все переменные х' являются независимыми, поэтому все левые 
части уравнений (I, 62) могут рассчитываться независимо для каж- 
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дого блока, что создает возможность параллельного счета на первом 
уровне. 

Задача 4. Поиск в пространстве управлений и некоторых пере- 
менных состояния [см. формулы (I, 79)— (I, 81)]. 

1. Этот подход в основном применяют, чтобы добиться безытера- 
ционного расчета критерия. Выбор в качестве независимых всех 
входных переменных к - го блока эквивалентен разрыву всех его вход- 
ных потоков. Поэтому в таком случае в качестве независимых пере- 
менных выбирают такие х<*>, (к = Рі , ..., р ч ), при которых резуль- 
тирующая схема оказывается разомкнутой, а система уравнений 
(I, 80) допускает безытерационный расчет. 

2. Учет ограничений (I, 81) проводится методами условной 
минимизации. 

3. Условия распараллеливания вычислений будут целиком 
зависеть от того, какие из входных промежуточных перемен- 
ных блоков схемы будут выбраны в качестве независимых пере- 
менных. 

Сравнение постановок задач. Подход, использованный в задаче 3, 
в известном смысле противоположен подходам, использованным 
в задачах 1 и 2, основной недостаток которых обусловлен необходи- 
мостью проведения трудоемких процедур решения системы нелиней- 
ных уравнений на первом уровне и значительным усложнением про- 
цедуры решения задачи 1 при наличии ограничений (I, 10). 

Основные недостатки использованного в задаче 3 подхода — это 
необходимость привлечения методов условной минимизации, сущест- 
венное увеличение числа поисковых переменных и штрафных членов 
в модифицированном критерии. Поэтому в непосредственном виде 
этот подход в настоящее время практически не используется. Однако 
на его основе могут быть построены специальные методы оптимизации 
больших систем (см. гл. V). 

Подход, использованный в задаче 4, является компромиссом 
между подходами, примененными в задачах 1 и 3, в нем сочетаются 
положительные стороны этих двух подходов, причем в некоторых 
случаях он может оказаться более эффективным. Действительно, 
пусть ограничения (I, 10) присутствуют и задача оптимизации ХТС 
сводится к задаче 1, для решения которой используется метод штра- 
фов. Пусть выбор переменных л:<*>, (к = р х , ..., р д ) делает схему 
разомкнутой. Тогда, если суммарная размерность этих векторов мала 
по сравнению с г, подход, использованный в задаче 4, может ока- 
заться предпочтительным по сравнению с примененным в задаче 1, 
поскольку незначительно увеличивая размерность задачи, он делает 
расчет критерия безытерационным. Конечно, число штрафных чле- 
нов в штрафной функции несколько увеличится (сравните и Ш. 
Однако мы исходим из предположения, что выполняется следующее 
свойство: если минимизируется штрафная функция, то добавление 
в нее небольшого числа новых штрафных членов, связанных с огра- 
ничениями типа (I, 56), ненамного ухудшает характеристики поиска. 
Хотя это правило нельзя доказать, более того, его можно и опроверг- 
нуть, построив специальные примеры, однако вычислительная 

5 Островский Г. М. 
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практика решения задач оптимизации ХТС показывает, что оно I 
часто выполняется. 

Оптимизация ХТС как многоуровневая процедура. Как мы видели, 
алгоритмы оптимизации ХТС, как правило, сводятся к многоуровне- 
вым процедурам (см. рис. 20, рис. 21). При построении эффективных 
алгоритмов многоуровневой оптимизации необходимо учитывать 
следующие правила. 

Правило 1. Алгоритмы каждого уровня должны рассматриваться 
как взаимосвязанные части единого алгоритма оптимизации, которые 
должны быть тщательно согласованы один с другим. 

Несколько усложнив работу алгоритмов одного уровня, можно 
существенно улучшить работу алгоритмов других уровней, что в це- 
лом приведет к более эффективной работе всей многоуровневой про- 
цедуры и, наоборот, улучшив работу алгоритмов одного уровня, 
можно усложнить работу алгоритмов других уровней, что приведет 
к менее эффективной работе всего алгоритма оптимизации. 

Проиллюстрируем это положение двумя примерами. 

За счет выбора поисковых переменных можно упростить задачу расчета схемы 
(первый уровень), сделав ее безытерационной (сведение задачи 1 к задаче 4), но 
существенно усложнить второй и третий уровень вследствие возрастания числа 
штрафных членов. И наоборот, можно усложнить алгоритм первого уровня, учтя 
в нем ограничения (1,10) (т. е. переходя к задаче 2), но существенно упростить вы- 
числения на втором и третьем уровнях (третий уровень вообще может выпасть). 

Другим примером может послужить выбор шага, т. е. величины 
коэффициента а, в соотношении (I, 39) при линейном поиске в методе 
безусловной минимизации, т. е. на втором уровне (см. рис. 20). При ■: 
применении методов безусловной оптимизации справедливо следую- 
щее: чем больше шаг вдоль направления, тем лучше. В том случае, 
когда первый уровень (расчет схемы) является безытерационным 
(з адача 4), это справедливо и для многоуровневых процедур. В случае, 
когда первый уровень (расчет схемы) является итерационным (задача 
1 для замкнутой схемы), это правило, вообще говоря, неверно. Дей- 
ствительно, при увеличении шага вдоль поискового направления 
действуют следующие противоположно направленные тенденции. 

С одной стороны увеличение шага вдоль направления дает хорошие . 
результаты, поскольку уменьшается число итераций на втором : 
уровне, но с другой стороны, увеличение шага ухудшает начальное | 
приближение при решении системы (I, 65), что может привести к уве- 
личению числа итераций на первом уровне. (При очень большом § 
шаге квазиньютоновский метод на этом уровне вообще может пере- 
стать сходиться.) Должен существовать некоторый компромисс, при 
котором шаг вдоль направления будет наилучшим с точки зрения 
общего числа итераций на первом и втором уровнях. 

Таким образом, критерием оценки эффективности процедуры 
оптимизации ХТС должно быть общее число к в расчетов левых частей 
системы (I, 65) в случае задачи 1 или системы (I, 72), (I, 73) в случае 
задачи 2. % 

к ! | 

к, = Ц 
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где іі — число расчетов левых частей этих систем при г'-том вычисле- 
нии критерия. Поскольку расчет левых частей системы (I, 72), (I, 73) 
эквивалентен однократному расчету соответствующей разомкнутой 
схемы, величина к 8 равна общему числу однократных расчетов соот- 
ветствующей разомкнутой схемы. 

Интересно отметить, что в случае решения системы (I, 65) на пер- 
вом уровне при слабой зависимости числа итераций от начального 
приближения может оказаться целесообразным вместо многократного 
решения системы (I, 65) на данном направлении р ь поиска безуслов- 
ного минимума, осуществляемого на втором уровне, провести одно- 
кратное решение системы п + 1-го уравнения: 

сІР 

г):' (х, щ + а Рі ) = о = О 

с (п + 1) неизвестным — вектором х и скаляром а (здесь Р — крите- 
рий оптимизации; р г — г-тое направление поиска безусловной опти- 
мизации; и-і — точка смены направления на (і — 1)-м направлении. 

Перейдем теперь к формулированию 2-го правила. В много- 
уровневой процедуре /-му шагу Де-го уровня соответствует 
некоторая итерационная процедура (к — 1)-го уровня. Так, /-му 
шагу алгоритма 2-го уровня (см. рис. 20) алгоритма безусловной 
минимизации соответствует итерационная процедура решения си- 
стемы нелинейных уравнений (I, 65) расчета стационарного режима 
ХТС. Итерационному шагу 3-го уровня соответствует итерационная 
процедура безусловной минимизации 2-го уровня. Для простоты 
изложения итерационную процедуру (к — 1)-го уровня, соответ- 
ствующую /-му шагу к- го уровня, будем называть /-той итерационной 
процедурой к- го уровня. Второе правило может быть записано сле- 
дующим образом. 

Правило 2. При построении начального приближения /-той итера- 
ционной процедуры к-то уровня необходимо максимально исполь- 
зовать информацию, полученную при проведении /-ой итерационной 
процедуры к- го уровня. 

Рассмотрим алгоритм первого уровня (см. рис. 20). Ранее было 
показано, что при і + 1-м решении систем нелинейных уравнений 
стационарного режима ХТС квазиньютоновским методом может быть 
использована информация о решении и матрице Якоби, полученная 
при і-том решении системы нелинейных уравнений. При этом есть 
надежда, что такой прием окажется успешным, поскольку критерий 
как функция независимых переменных обычно является пологой 
функцией (кривизна ее мала), и шаг на втором уровне изменяет управ- 
ления не на очень большую величину, т. е. выполняется условие 
(II, 196). При решении систем нелинейных уравнений 1-го уровня 
(см. рис. 20) методом Ньютона начальное приближение для ( і + 1)-го 
решения систем нелинейных уравнений также может быть построено 
с использованием предыдущей информации (II, 200). 

Рассмотрим теперь второй уровень алгоритма (см. рис. 20), 
соответствующий безусловной минимизации штрафной функции 

/?<*> = / + р (й ѵ 
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при фиксированном значении штрафного коэффициента |Ѵ А) . При этом 
для простоты мы предполагаем, что в задаче (IV, 1), (IV, 3), (IV, 4) 
имеется только одно ограничение типа равенства. Значение коэффи- 
циента р (А) назначается на третьем уровне. Обозначим через Н*' 
предельное значение матрицы # г , полученной при минимизации 
каким-либо квазиньютоновским методом минимизации. По- 
скольку Н*і будет близко к обратному гессиану функции Р и> , 
естественно при минимизации функции рѵ+ 1 '> для, = &[)(/') , 

(к > 1) взять в качестве Н 0 матрицу Н*>. Аналогичным образом 
можно поступить и при использовании метода уровней и модифици- 
рованного метода множителей Лагранжа. Однако, при значительном 
увеличении штрафного коэффициента здесь может быть допущена 
большая погрешность. Поэтому рассмотрим другой прием. Пусть 
будет аппроксимироваться сам гессиан, и при проведена оптими- 
зация функции ри ) , в результате которой получено значение предель- 
ной матрицы В*>. Выполняется соотношение 

Ѵ 2 / г</) = V 2 / + р (/) ѵ V (IV, 59) 

Надо оценить гессиан у 2 ри+ 1 ) в той же точке 

у2^(/+1) _ р(/+1)у2 (( ,2 

Подставляя в это соотношение V 2 / из соотношения (IV, 59), а также 
заменяя ѴЯ 7(/) близкой к нему матрицей В*і, получим 

ѵ 2 /г(/+і) = в*/ 4- (р(/+і) _ р(/)) ѵѴ 

Воспользовавшись аппроксимацией [11, с. 133] для Ѵ 2 ф 2 , можем 
найти Ѵ^/'+о и взять ее в качестве начального приближения для 
матрицы В при минимизации функции рѵ+ •>. Рассмотрим теперь 
выбор шага, т. е. коэффициента а, в уравнении (I, 39) при линейном 
поиске в методе безусловной минимизации, для случая, соответствую- 
щего 'задаче 4. Поскольку при этом первый уровень безытерацион- 
ный, на величину оѴне накладывается ограничений со стороны пер- 
вого уровня и он должен выбираться из условия, чтобы число вычис- 
лений целевой функции было минимально. На каждом направлении 
происходит линейный поиск точки, удовлетворяющей условиям 
(I, 47). Он начинается с начального шага а?. Выбор этой величины 
существенно влияет на число шагов на данном направлении, а, сле- 
довательно, и на общее число шагов. Естественно предположить, что 
на двух соседних направлениях і-том и ( і + 1)-м расстояния ||х і+1 — 
— Хі |1 и 1 Хі — х і+1 \\ будут близки, поэтому начальный шаг на 
(і + 1)-м направлении разумно выбирать из условия а°+і = ка *, 
где множитель к близок к единице и выбирается на опыте по данным 
вычислительного эксперимента. 

Остановимся теперь на задаче определения частных производных 
критерия при применении первого подхода; в качестве примера возь- 
мем схему, приведенную на рис. 5. Для простоты будем считать, что 
в каждом блоке имеется только одна управляющая переменная. 
Тогда при применении разностного метода вычисления производных 
потребуется N + 1 итерационных процедур расчета замкнутой 
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| схемы. Опишем более экономный способ вычисления производных. 
I Пусть итерируемыми переменными при расчете схемы (см. рис. 20, 
? уровень 1) будут входные переменные блока 2. Обозначим их через х. 

Тогда расчет сводится к решению системы (II, 6), где компоненты 
| вектора Р являются выходными переменными блока 1 разомкнутой 
схемы (см. рис. 6). Критерий Ф можно считать сложной функцией 
переменных 

Ф = Ф (х, и) 

где х — неявная функция переменных и, определяемая соотношением 
(II, 6). Продифференцируем Ф по переменным и 


дФ__дФ_ дх дФ 
ди дх ди ди 


(IV, 60) 



дФ 

ди 


\ дх 

) ~дй 


дР_ 

ди 


(IV, 61) 


Решив систему линейных уравнений (IV, 61), найдем производные 
дхіди. Подставив их в выражение (IV, 60), найдем искомые производ- 
ные. Для их определения необходимо знать производные дФ/дх, 
дФІди, дРІдх, дРІди. С точки зрения схемной интерпретации эти 
величины (дФ/ди, дФ /дх) представляют собой производные критерия 
по управлениям и входным переменным разомкнутой схемы (см. 
рис. 6) соответственно, а дР/дх, дРІди — - производные выходных 
переменных блока 1 по входным и управляющим переменным разомк- 
нутой схемы (см. рис. 6). 

Итак, для определения производных критерия оптимизации замк- 
нутой схемы необходимо рассчитать частные производные ряда ве- 
личин разомкнутой схемы. Определение этих величин не требует 
проведения итерационных процедур. В этом состоит основное пре- 
имущество данного подхода. Кроме того, при вычислении производ- 
і ных в разомкнутой схеме можно воспользоваться «зонами влияния» 

I [3, с. 136], что может также существенно сократить число вычисле- 
I ний. Правда, использование этого подхода требует решения системы 
I линейных уравнений. Покажем, что используя информацию, получен- 
| ную на первом уровне (см. рис. 20), можно еще более повысить эффек- 
і тивность этого метода. Будем исходить из предположения, что для 
I решения системы (II, 6) на первом уровне (см. рис. 20) используется 
I квазиньютоновский метод О&М. Обозначим через Я* предельное 
I значение матрицы Я; [см. соотношение (11,101)]. Матрица Н ( 

\ аппроксимирует обратную матрицу Якоби системы (II, 6), в пределе 
I можно ожидать, что матрица Я* стремится к обратной матрице . 
; Якоби этой системы, т. е. что будет выполняться равенство 

I «Ч'-^Г 


Отсюда, воспользовавшись выражением (IV, 61), 


дх 

~дй 



получим 
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Рис. 22. Схема последовательности блоков. 


Вычисление производных с помощью этой формулы не требует во- 
первых, решения системы линейных уравнений, а во-вторых, вычис- 
ления производных дР/дх, что существенно сократит объем вычисле- 
ний. Таким образом, обеспечение хорошей сходимости матрицы Н ь 
к матрице Якоби системы (II, 6) дает экономный способ определения 
искомых производных. Более того, подставив матрицу дх/ди в фор- 
мулу (II, 200), можно получить начальное приближение для решения 
системы (II, 6) при и = ы і+1 . 


Выбор поисковых переменных. Как мы видели, каждая из рассмотренных задач 
имеет свои отрицательные и положительные стороны. Естественно поставить вопрос 
о том, в каких случаях целесообразно применять ту или иную из них. Такие реко- 
мендации можно дать только для отдельных случаев: 


Номер задачи, 
которую целесо- 
образно исполь- 


зовать 

Схема разомкнута, отсутствуют ограничения (1,10) 1 

Схема разомкнута, имеются ограничения (1,10), 
производные критерия вычисляются аналитиче- 
ски * 1 или 2 

Схема замкнута, большинство блоков охвачено 
обратными связями 4 


* Как будет показано далее при разностном вычислении производных 
более эффективным может оказаться четвертый подход. 


Поскольку выбор той или иной задачи связан с выбором поисковых (независи- 
мых) переменных, поставленный вопрос фактически сводится к выбору наилучшей 
совокупности поисковых переменных. Проблема близка к проблеме выбора мно- 
жества разрываемых потоков в задаче расчета стационарного режима схемы [3, 
с. 33]: и в том и в другом случае речь идет о выборе наилучшей совокупности ите- 
рируемых переменных. Задача выбора оптимальной совокупности поисковых пере- 
менных при оптимизации ХТС чрезвычайно сложна. Сложность ее связана с труд- 
ностью формулирования критерия, который позволял бы оценивать тот или иной 
набор поисковых переменных без решения задачи оптимизации ХТС. Наилучшим 
критерием, конечно, является время, затраченное на решение задачи, но его можно 
определить только, решив задачу оптимизации. Поэтому цель состоит в том, чтобы 
косвенным путем оценить это время. Строго поставить и сформулировать эту задачу 
трудно. Придется пользоваться некоторыми эвристическими правилами, экспери- 
ментальными фактами, которые помогут сформулировать эту задачу хотя бы и не 
очень строго. 

В виде примера рассмотрим задачу оптимизации последовательности блоков 
(рис. 22). В дан ном слу чае т& т пи = п, {к = 1 , N), х г ,іг= п, х* = 0, (к = 2, А'), 

ёк = 0, (к = 1, N — 1), ём = п, Гк = г, (к = 1, іѴ). Соотношения связи (I, 2) 
имеют простой вид: 

х\ к) - у^~ Х) =0 і =- ТГп к = 277/ (IV, 62) 
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„ пп 1“ учае сведения задачи оптимизации к задаче 1, когда поисковыми являются 
іощая задача 80 ^ бЛ ° К ° В СХеМЫ ’ НЭ ВТ ° Р ° М УР ° ВНе (риС ' 20) будет Р ешать ся следу- 
гдг 

"|Й [ Р + Р ~ а /" ) ) 2 к = ТГы р » 1 (іѵ, 63) 

и І — 1 -* 

где определя ются п оследовательным расчетом всех блоков при заданных зна- 
чениях и ( *1, (к = 1, Ы). 

Рассмотрим теперь постановку, приводящую к задаче 4. В качестве поисковых 
переменных наряду с управлениями ы<*>, (к = 1, V) выберем переменные 

Х \ и = 1> п ’ к = V. , . , . /Т\/ СЛ\ 


(і = 1 , п- к = Рѵ .... р ч ) 

Тогда на втором уровне будет решаться следующая задача: 


(IV, 64) 


,й„ Г + 2 (*г - °/) 2 + 2 Д (*? 


х = Рь • ■ ■ , р ч к — N (IV, 65) 

Число поисковых переменных в данном случае будет равно т = г х + ... + г^ + 

п Будем считать . что частные производные вычисляются с помощью разностей 
Поставим задачу определен ия «н аилучшей» совокупности переменных (IV, 64). Обо- 

значим через % к = т, (к = 1, Л+ Т ъ Т 2 соответственно, время расчета й-го блока 
? И Цн ГРВДИе п НТа Критерия - Ясно, что Т х = тѴ. Сделаем следующие допущен™! 
1. Число поисковых направлений при решении задачи оптимизации пропор- 

'■ '• V». г* V некоторый 

Число 6 вычислений критерия на каждом поисковом направлении по- 
достаточноТтабиГь^ показывает, что величина 6 действительно является 

лежи? в “предках от 4 до Ѵ™ аЛГ ° РИ ™ а - используемого в нашей практике, она 

3. Выполняется свойство штрафных функций (см. с. 129). Используя первые 
задачиТтГи Я з’ацТи: УЧИМ ГРУбуЮ ° ЦеНКУ ВреМ6НИ Т ’ зат Р а чиваемого I решение 
Т = ЬутТ 1 + утТ 2 = ут (6Т 1 + Т 2 ) 

Величину Т будем использовать в качестве критерия для выбора переменных (II 641 
Для вычисления частных производных используем «зоны влияния» [3 с І36]' 
применение которых позволяет существенно сократить число вычислений нІ 

со 0 с М тоящую°из блоков^ п .°7 едовате ^ ьно г с ™ ( см - Рис- 22) имеет «зону влияния», 
состоящую из блоков й, й + 1, ..., /V. Совокупность блоков с номерами от ръ 
Д° Рк+і — 1 будем называть &-тым участком. н 

л „й РаССМОтрш частный случай, когда последовательность блоков (см рис 221 
разбивается на участки с равным числом блоков, т. е. р к+1 _ Рк = Ѵ/(о + 1) 
Новыми выходными переменными схемы будут г ( ‘> (і = п — 1 _ п д ' 

вычисления частных производных критерия по управлениям и в’ходнь^ переменным 
дгь (к + 1)-го участка (к = 1,9) равно 

тпѴ ^ _1 гп [ N , , \ 

9+ 1 + 2 9+1 V ? + 1 + 1 ) 

Отсюда общее время Т равно [101] 

Т = %у(гЫ + «9) 6Ѵ + лѴ + 0,5гІѴ ^-Ду+ 1^ 

ЛѴ К в4і 3 гвй^,. ВЫбОРа оптимал ьной совокупности дополнительных переменных 
(IV, 64) свелась к минимизации функции Т по целочисленной переменной д. Из этой 
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формулы ясен эффект введения переменных (IV, 64). Действительно, если АѴ » щ, 
то с увеличением ц член, стоящий в первых скобках, увеличивается незначительно, 
а третье слагаемое во вторых скобках уменьшается примерно пропорционально ц. 
Следовательно, при достаточно больших N увеличение д может привести как к умень- 
шению величины, стоящей в этой скобке, так и общей величины Т. 

Использование этого подхода к задаче оптимизации последовательности реак- 
торов идеального смешения [11, с. 50 ] показало его эффективность. На этом при- 
мере ясно видна также польза введения дополнительных поисковых переменных 
для распараллеливания вычислений в случае использования многопроцессорных 
ЭВМ или многомашинных комплексов. Благодаря последовательной структуре 
схемы (см. рис. 22) здесь может эффективно использоваться только одна ЭВМ. Вве- 
дение же дополнительных поисковых переменных позволяет параллельно обраба- 
тывать отдельные участки на нескольких ЭВМ. 


Оптимизация процесса Вильямса— Отто 

В главе II было дано описание химико-технологического процесса 
Вильямса— Отто и приведена его математическая модель. Задача 
оптимизации заключается в том, чтобы выбрать такой режим проведе- 
ния процесса, при котором годовой доход, выраженный в процентах 
к сумме вложений в производство, оказывается максимальным. Рас- 
смотрим составляющие дохода: 


Объем сбыта (за 1 ч) 0,3 ? Р + 0,006 8Р В 

Стоимость сырья (за 1 ч) 0 ,02Рд + 0,03 Р в 

Затраты на обработку отходов (за 1 ч) ... . 0,01 /у? 

Водо-, паро-, энергоснабжение (за 1 год) . . . 2,22 Рр 

Издержки на сбыт, администрацию и науч- 
ные исследования, % объема сбыта 12,4 

Затраты на амортизацию и ремонт, % суммы 

капитальных вложений/год 10 

Капитальные затраты бООѴр 


Продолжительность работы производства в течение года состав- 
ляет в среднем 8400 ч. Критерий оптимизации (максимизации) 
принимает вид: 

/ (х) = 100 [8400 (О.ЗРр + 0, 0068 Ад — 0,02? А — 0,03? в — 0,01 Р а ) — 

— 0, 124- 8400 (0,ЗА> + 0,0068/^) — 60Ѵр — 2, 22Кр]/600Ѵр (IV, 66) 

В дополнение к обычно используемым варьируемым переменным 
Р А , Р в , Т и коэффициенту рецикла а введем V — объем реактора. 
Оптимальный режим должен удовлетворять заданным ограничениям 
на температуру Т внутри реактора и производительность процесса 
Р р по целевому продукту Р: 

580 «с 680 (IV, 67) 

0^Кр^4763 (IV, 68) 

Выражения для Р Р , Р а и Р в , необходимые для расчета / (х) 
по формуле (IV, 66), имеют вид: 

Рр = ?В.р — О.ІКря 

Р 0 = ^^к 3 ?р С РррѴрі? 2 р 

?й = (1 — «) (?? — ?а — Рр) 
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(IV, 69) 
(IV, 70) 
(IV, 71) 


Наряду с приведенной выше постановкой задачи оптимизации, где 
ограничения на производительность по продукту Р имеют вид нера- 
венств (IV, 68), рассматривался другой вариант этой задачи, в кото- 
ром фиксирована производительность по Р: 

Р р = с = сопбі (IV, 72) 


Значение постоянной с принималось равным 4763 (для сравнения 
задач в первой и второй постановках по трудоемкости их решения), 
а в некоторых случаях равным 4300. При проведении решения огра- 
ничение (IV, 72) учитывалось путем введения соответствующего 
штрафного члена в функцию условной минимизации. Учет уравнений 
модели выполнялся двумя способами. В первом из них переменные 
Р ЯА , Р яв , Р нс , Р ЯР , Р ЯЕ включались в список варьируемых пере- 
менных задачи оптимизации (в дополнение к Р А , Р в , Т, V, а). В та- 
ком случае уравнения модели (II, 124) — (II, 126) при постановке 
задачи оптимизации интерпретировались как ограничения типа 
равенства (на эти переменные) и учитывались механизмом условной 
оптимизации [см. задачу 4, (1,79) — (1,81)]. При втором способе 
совокупность уравнений модели (II, 124) — (II, 126) трактовалась как 
система нелинейных уравнений относительно Р ВА , Р вв , Ррс, Ррр, 
Р ЯЕ , решение которой выполнялось для каждого фиксированного 
набора значений варьируемых переменных Р А , Р в , Т, V, а, вычислен- 
ных в процессе оптимизации [см. задачу 1, выражения (I, 64) — 
(I, 66)]. Решение системы уравнений модели выполнялось как раз- 
личными методами [<ЭЫМ и Вгоубеп, см. формулы (И, 121), (II, 49)], 
так и простой итерацией. Использовались модификации (^ЫМІ и 
Вгоуйеп 1 с уменьшением квадрата нормы левых частей системы на 
каждом из направлений движения. В качестве начального приближе- 
ния к решению Р# А , Р яв , Р вс , Ррр, РрЕ системы для текущего 
набора значений варьируемых переменных Р А , Р в , Т, V, а прини- 
мались значения Р ВА , Р вв , Рр С , Ррр , РрЕ, найденные для преды- 
дущих значений Р А , Р в , Т, V, а. Кроме того, в модификациях 
(^ЫМІН, Вгоуйеп 1Н в качестве начальной аппроксимации Я 0 обрат- 
ного якобиана при данных значениях Р А , Р в , Т, V, а использо- 
валась матрица Я, определенная в результате решения системы 
уравнений модели для предыдущих значений Р А , Р в , Т, V, а. В ка- 
честве алгоритма оптимизации применялся метод модифицированной 
функции Лагранжа в сочетании с методом ОРР на нижнем уровне и 
разностным способом расчета производных. В табл. 21 приведены 
результаты решения задачи оптимизации с условиями (IV, 68), 
а в табл. 22 — для задачи с фиксированной производительностью 


(IV, 72). 

Каждый результат представлен тремя числами: Я/, К Р , Кг 


— число обращений к расчету «разомкнутой» схемы, включая 
обращения для расчета производных с помощью разностей). 

В качестве начальных приближений для переменных Р А , Р в , 
Т, К, а и Р КА , Р вв , Р к с, Ррр, Рр е использовались значения [39], 
соответствующие V = 60, приведенные в табл. 3 (см. начальные точки 


1, 2, 3). Решение задачи удалось получить не для всех вариантов, так 
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Т°« есса Вильямса-Отто 


А 

К 

Результаты оптимизации 

р нача 
"ОЧКИ 

уравнения 

модели 

трактуются 

уравнения модели 

трактуются как системы нелинейных 
уравнений 

Номе 

ной 

чения типа 
равенств 

простая 

итерация 

ОЫМ1 

Вгоусіеп 1 

ОИМ1Н 

Вгоусіеп 1 Н 

1 

19891 

5800 

77892 

114 

27 

23375 

324 

36 

5249 

— 

220 

24 

1551 

— 

2 

3116 

992 

13037 

138 

32 

27522 

137 

22 

2160 

132 

19 

1990 

180 

22 

4331 

— 

3 

2009 

602 

8030 

217 

45 

28642 

109 

20 

1750 

132 

27 

2390 

92 

19 

1357 

88 

А 7 

723 


I * б ,1о Ц а » 22 Ре3ультаты оптимизации процесса Вильямса-Отто 
при заданной производительности по продукту Р ( Р р = сопзі) 


Результаты оптимизации 


Номер начальной 
точки 

уравнения мо- 
дели трактуются 
как ограни- 
чения типа 
равенств 

уравнения модели трактуются как системы нелинейных 
уравнений 

простая 

итерация 

(ЗЫМ! 

Вгоусіеп 1 

<?кмш 

Вгоусіеп I Н 

СО 

II 

о. 

СО 

СО 

•** 

II 

о, 

ь. 

со 

ч* 

II 

0, 

ь. 

СО 

СО 

II 

0, 

о. 

О 

О 

СО 

ч}< 

II 

0* 

ц. 

СО 

со 

ь- 

I 

Ь, 

О 

О 

СО 

тг 

0, 

о. 

СО 

со 

Г'~- 

II 

Оя 

о. 

СО 

СО 

ь- 

ч*' 

II 

Ом 

О, 

О 

О 

со 

■<* 

II 

0, 

ь. 

1 

2 

3 

3736 

1233 

16063 

3610 

1168 

15291 

2215 

717 

9386 

5064 

1588 

20945 

2090 

686 

8931 

2513 

800 

10514 

172 

26 

25533 

141 

18 

18806 

103 

23 

16131 

135 

37 

2691 

122 

35 

2440 

86 

18 

1511 

155 

43 

3067 

143 

36 

2711 

89 

20 

1659 

158 

41 

16224 

143 

36 

10726 

76 

18 

1409 

156 

47 

3087 

128 

36 

2549 

89 

20 

1597 

136 

33 

1294 

130 

35 

1243 

89 

21 

736 

146 

34 

1294 

143 

39 

1438 

89 

19 

883 

144 

41 

1507 


как в некоторых случаях метод модифицированной функции Лаг- 
ранжа, будучи методом внешней точки, приводил к появлению (в про- 

ОММ Р ^ Я) * ТаКИ / значений р в, Т, V, а при которых методы 
УММ или (и) Вгоусіеп решения системы (II, 124)— (II, 126) не схо- 
дились, либо давали отрицательные значения величин Р КА , Р» н , 
гцс, г Н р, Р НЕ . Появление таких ситуаций частично удалось пре- 
одолеть_введением соответствующих замен переменных, например, 
Р'на = Р%а для предотвращения отрицательных значений Р НА при 
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решении системы уравнении, или переход от а к а с помощью функции 
агсі§, обеспечивающий выполнение неравенств 0 < а < 1 при прове- 
дении оптимизации. 

В оставшихся нерешенными вариантах неудача может быть 
объяснена либо отсутствием решения системы (II, 124) — (II, 126) 
в какой-либо промежуточной точке Р А , Р в , Т, У, а оптимизации, 
либо достаточной «удаленностью» промежуточной точки оптимизации 
от предыдущей (несмотря на предусмотренное в алгоритме оптимиза- 
ции ограничение на величину р (<р шах ) начального шага по направле- 
нию поиска), в результате чего начальное приближение по Р НА , 
Р^в, Рнс, Р^р, Рце, являющееся решением системы для предшест- 
вующей точки в пространстве варьируемых переменных, оказывается 
неудовлетворительным для данной (текущей) точки Р Ау Р в , Т, V, а 
и алгоритмы ((>N14 и Вгоубеп не «срабатывают». 

Анализ результатов показывает, что наибольшей эффективностью 
(наименьшее Кі — число расчетов «разомкнутой» схемы) обладает 
«традиционный» подход — решение системы уравнений (II, 124) — 
(II, 126) относительно переменных Р КА , Р вв , Р яс , Р КР , Р ЯЕ для 
каждой точки Р А , Р в , Т, V, а, определяемой в процессе оптимизации, 
при условии, что решение системы выполняется достаточно сильными 
методами (<ЗЫМ, Вгоубеп). При этом использование модификаций 
алгоритма: (ЗІЧМ1Н, Вгоубеп 1Н дает наилучшие результаты. Для 
вариантов с начальными точками 2 и 3 (см. табл. 22) и при использо- 
вании метода ((ШМ1Н имелось несколько результатов, для которых 
Ртах = КГ 5 — ІО' 1 ; при изменении р шах в этих границах с ростом р тах 
значение Кі сначала уменьшалось, а затем увеличивалось; в таблице 
приведен «оптимальный» по р шах (Ртах = 0,001) результат. 

Применение простой итерации для решения уравнений модели 
(II, 124) — (II, 126) оказывается нецелесообразным и дает наихудшие 
результаты. Если уравнения модели (II, 124)— (II, 126) учесть в алго- 
ритме оптимизации в качестве ограничений на переменные Р ВА , 
Рцс, Ррр, Рке, то по числу вычислений этот случай будет 
промежуточным. Сопоставление результатов, приведенных в первых 
столбцах табл. 21, 22, показывает, что добавление еще одного ограни- 
чения (Р Р = соп5І) к уже имеющимся не приводит к существенному 
увеличению значений /С/, К р , Кі при таком способе решения задачи. 

В заключение отметим, что при традиционном подходе к решению 
задачи оптимизации среднее число обращений к расчету разомкнутой 
схемы, приходящееся на одно вычисление критерия оптимизации 
(включая разностные оценки производных), колеблется в пределах: 
для метода простой итерации — от 70 до 100, а для квазиньютонов- 
ски х методов — от 4 до 9. 

Решение задачи оптимизации процесса 
разделения изомеров октана 

Описание схемы процесса разделения изомеров октана (см. рис. 1), 
его математическая модель и постановка задачи оптимизации были 
приведены в главе I. В схеме процесса присутствует циркулирующий 
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Таблица 23. Результаты оптимизации * для различных А хі 


Д*і 

х і 

к ! 


Кі 

1* 

II Ф, II 

н\\ 

к 

“о -“шах 

^шах 

ю- 3 

1087 

186 

10 

25,6 

ІО" 6 

0 

0 

1— ІО 6 

1 — ІО 6 

10- 4 

842 

189 

6 

25,5 

ІО" 4 

0 

0 

1 — 10 5 

1— ш 5 

Ю" 6 

671 

153 

7 

25,6 

10-8 

10-8 

0 

1— ІО 6 

1— ІО 5 

ІО" 6 

1395 

343 

6 

25,6 

10-8 

10-8 

0 

1— ІО 6 

1— ю 6 

10" 7 

1262 

308 

6 

25,6 

10-« 

0 

0 

1 — 108 

1— ІО 5 

ІО" 8 

1230 

262 

6 

25,6 

10-« 

10-8 

0 

1 — 108 

1— ІО 5 

10-8 

1583 

409 

8 

591,3 

ІО- 2 

0 

0 

1— ІО 5 

1 — ІО 5 

10-ю 

916 

199 

6 

25,6 

10-8 

0 

0 

1— ІО 5 

1—10 5 


* Коэффициент при у в в выражении (1,29) был принят равным «16,967. 


поток / Л , возвращаемый на вход схемы с выхода блока изомеризации. 
Рецикл можно учесть двумя способами: на уровне расчета схемы при 
итерациях по лу [см. задачу 1, выражения (I, 64)— (I, 66) ] и при 
оптимизации, рассматривая его как ограничение типа равенства на 
разрываемую переменную лу [см. задачу 4, выражения (I, 79) — 
(1,81)]. При решении был применен второй способ. Оптимизация 
проводилась с применением методов последовательной безусловной 
минимизации: метода модифицированной функции Лагранжа (АЬ) 
и штрафных функций (РЕІЧ), на нижнем уровне которых использо- 
вались квазиньютоновские алгоритмы БЕР, 55ѴМ. Расчет производ- 
ных выполнялся разностным способом [см. выражение (1,49)]. 
В процессе оптимизации для удержания значений варьируемых пере- 
менных Хі (напомним, что х г — коэффициенты разделения газовых 
потоков) между нулем и единицей применялись замены переменных 
с использованием функции агс1§. Функции, участвующие в постановке 
задачи оптимизации, наиболее чувствительны (в окрестности х*) 
к изменению х и лг 3 , х 7 . В связи с этим для повышения стабильности 
получаемых результатов применялось преобразование сжатия по 
осям х г , х 4 , х 5 , х в , что можно сравнить с процедурой [11, с. 82 — 83]. 
Ъ табл. 23 приведены результаты решения рассматриваемой задачи 


Таблица 24. Результаты оптимизации процесса получения 
изомеров октана =10~ 5 ^ 


Обозначение метода 
минимизации 

к, 

к р 

«1 

і* 

ІІФіІІ 

К + 1 

к 

“о -“шах 

Рщах 

услов- 

ной 

безус- 

ловной 

АЬ 

РРР 

671 

153 

7 

25,6 

ІО"» 

ІО" 6 

0 

1—108 


АЬ 

88ѴМ 

1285 

337 

8 

593,9 

іо - 4 

0 

0 

1— ІО 5 


РЕК 

вроз 

2721 

559 

5 

591,7 

10-8 

0 

0 

1—108 


РЕК 

РРР 

767 

180 

8 

25,6 

ІО" 3 

10-8 


1—10® 
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Методом модифицированной функции Лагранжа с использованием 
ОРР, относящиеся к выбору приращений Ах ь варьируемых перемен- 
ных для расчета градиента разностным способом, а в табл. 24 — 
результаты оптимизации с применением других методов решения. 
При этом в случае использования метода множителей Лагранжа при 
изменении К весовые коэффициенты в штрафных членах увеличи- 
вались вдвое, а при методе штрафных функций — на порядок. 
Найденное оптимальное значение критерия составляет /* = 25,6 % 
при х* = (1834,22; 0; 0,63533; 1; 0; 1; 0,751795). 

Расчет оптимальных стационарных режимов 
контактных узлов сернокислотного производства 

Одной из основных химических реакций в процессе получения серной кислоты 
является каталитическое окисление диоксида серы в триоксид 

50 2 + -і- 0 2 ^ 50 3 (IV, 73) 

В промышленных условиях эта реакция осуществляется в контактных аппаратах, 
представляющих собой многослойный каталитический реактор с встроенными между 
слоями и выносными теплообменниками, предназначенными для отвода реакционного 
тепла. Основное применение в сернокислотной промышленности получили схемы 
контактных узлов, работающих по методу одинарного (одностадийного) контакти- 
рования (рис. 23) и по методу двойного контактирования и двойной абсорбции 
(рис. 24). Последний метод предполагает организацию двухстадийного контактиро- 
вания. На рис. 24 представлена схема (3 + 1), первая стадия которой включает 
первые три слоя катализатора, а вторая — последний слой в реакторе. Каждая из 
стадий контактирования завершается абсорбцией 50 3 . Разделение процесса окис- 
ления на две стадии с последующей абсорбцией З0 3 способствует увеличению ско- 
рости реакции (IV, 73) на заключительной (второй) стадии вследствие значительного 
снижения эффекта торможения реакции продуктом 50 3 ,что позволяет достичь более 
высокой степени превращения 50 2 в 50 3 по сравнению с получаемой при односта- 
дийных схемах контактирования. 

На рис. 23 приведена схема весьма распространенного на химических заводах 
пятислойного контактного аппарата с поддувом свежего газа после первого слоя 
катализатора. Поток сернистого газа О, поступающего на окисление, последова- 
тельно нагревается во внешнем теплообменнике и в теплообменнике после второго 



Рис. 23. Схема контактного узла окисления 50 2 : 

1,2 — внешний и выносной теплообменники; І — Ѵ — слои катализатора. 
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Рис. 24. Схема контактного узла окисления $0 2 по методу двойного контактирования и 
двойной абсорбции: 

І — 4 — теплообменники; 5 — реактор; / — IV — слои катализатора. 


слоя катализатора до температуры, обеспечивающей устойчивое протекание реак- 
ции (IV, 73), а затем поступает в первый слой катализатора, где (IV, 73) проводится 
адиабатически (без отвода тепла) до достижения температуры, близкой к равновес- 
ной, определяющей прекращение реакции окисления. Снижение температуры окис- 
лившегося в первом слое газа, необходимое для дальнейшего проведения окисления 
Бог, достигается добавкой (поддувом) относительно холодного диоксида серы (по- 
ток 0 8 ) в смеситель, установленный в аппарате. Охлажденный газ поступает во вто- 
рой слой катализатора, где протекает последующее окисление диоксида серы, со- 
провождаемое выделением тепла и повышением температуры до величины, близкой 
к равновесной. Теплообменник, куда поступает газ, после второго слоя катализа- 
тора, снижает температуру реакционной смеси, которая затем подается в третий слой, 
и т. д. Промежуточные теплообменники выполняют двойную функцию: охлаждают 
окислившийся^ в соответствующем слое катализатора газ и нагревают газ, подава- 
емый в первый слой катализатора (теплообменник после второго слоя) и на поддув 
перед вторым слоем (теплообменники после третьего и четвертого слоев). С целью 
управления температурным режимом контактного узла газовая нагрузка О аппа- 
рата перераспределяется между теплообменниками (потоки С 5 , 0„, О 10 ), добавляется 
поток О, холодного газа, подаваемый на вход первого слоя катализатора, а часть 
0 12 холодного газа байпасируется мимо внешнего теплообменника. 

Таким образом, контактный узел сернокислотного производства представляет 
собой сложную химико-технологическую систему, характеризующуюся наличием 
взаимовлияющих параметров и обратных тепловых потоков. 


Математическая модель контактного узла [82, 83] описывает 
элементы схемы и связи между ними. 

Слой катализатора. В і'-том ( і = 1, 5) слое катализатора про- 

цесс окисления диоксида серы в триоксид, протекающий по реакции 
(IV, 73), описывается уравнением [84] 


ах 


к^_ 

а 
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1 
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( г (.))2 


К 0 ) 2 О 


7(012 


М) 


7(0 


(IV, 74) 
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совместно с уравнением 

1 и) (Т) '«= ( {і) 


где 


ехр 


(0) + Х[г ( ‘> (т)— г<‘> (0)] 

Е (і) /1 1 \ 

Я ( Г < ‘ ) т * I 


(IV, 75) 
(IV, 76) 


Здесь г (і) — степень контактирования, т. е. доля окислившегося 
диоксида серы от общего его содержания в исходном газе; т — 
текущее время контакта; к (і) — константа скорости реакции (IV, 73); 
/е<‘> — константа, характеризующая катализатор; Е м — энергия 
активации; Я — газовая постоянная; Т (і) — некоторая характерная 
для данного катализатора температура; ( (1) — текущее значение 
температуры; і (і) (0) — температура газового потока на входе в слой 
катализатора; % — коэффициент адиабатического разогрева; г ( ‘> (0) — 
начальная степень контактирования (на входе в слой); а — концен- 
трация сернистого ангидрида в исходном газе (в долях единицы); 
Ь — концентрация кислорода в исходном газе (в долях единицы); 
К р 1) — константа равновесия реакции (IV, 73). 

Равновесное значение г р 1) степени контактирования определяется 
соотношением 



Если степень контактирования, определяемая выражением (II, 74), 
достигает своего равновесного значения с заданной точностью при 
некотором т = т < т (1> : 

г (і) (х)^г { р 1) 

то процесс интегрирования уравнений (IV, 74), (IV, 75) обрывается, 
поскольку при этом считается, что дальнейшего изменения (в преде- 
лах заданной точности) степени контактирования г* 1 ') и температуры 
і (і) в слое катализатора не происходит 

г<‘> (т) =г<‘> (т) =г<'> *<‘>(т) * 1 (!) (т) = і ( р п (IV, 78) 


Теплообменник. Математическое описание теплообменников со- 
держит уравнения материального и теплового балансов. Уравнения 
теплового баланса теплообменника могут быть записаны в виде 

<2 ет-0 0 Со (Іо. п — Іо. к) П (2 ОізСв (І в. к — Іа. н) Ц Я ~ &Р Л^ср. лФ 

(IV, 79) 


где (2 — количество тепла, отдаваемое «горячим» газом; О — поток 
теплоносителя (индексы «о», «в» относятся соответственно к величи- 
нам, характеризующим потоки отдающие и воспринимающие тепло); 
с — теплоемкость газа; і — температура газового потока (индексы 
«н», «к» относятся соответственно к начальному и конечному ее 
значениям); ц (*=»1) — коэффициент, учитывающий тепловые потери 
в окружающую среду; к — коэффициент теплопередачи; Р — по- 
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то«п Н0СТЬ тепл00бме 2 а ; Л ^р- л ~ среднелогарифмическая разность 
температур; ф^— коэффициент, учитывающий отклонение движения 

следует СИТеЛеИ ° Т идеального противотока. Из уравнений (IV, 79) 

ехр [2М (1 —IV)] — 1 

“ (IV, 80) 


где 


к — Ія. II + (іо. II — ія. н) N 
Іо. к = іо. н (+. н — Ія. н) 

Оос 0 


ехр [2 М (1 — IV)] — N 
ехр [2 М (1 —IV)] — 1 
ехр [2Л4 (1 — IV)] — N 


N = ■ 


@В С В 


м 


кР(р 

2СоГо 


(IV, 81) 
(IV, 82) 


ри известных режимных (/ 0 . „, і в . а ,С 0 ,6 в ) и конструктивных (число 
т;°вп ИаМетр ’ длина ) па Р а метрах теплообменника формулы (IV, 80) 
(IV. 81) позволяют вычислить температуры охлаждаемого и нагре- 
ваемого газовых потоков на выходе из теплообменника. 

Соотношения связи между слоями катализатора и теплообменни- 
ками определяются из уравнений материального (сохранения общего 
количества вещества) и теплового балансов в соответствии со структу- 
рой схемы. Так например, согласно схеме контактного аппарата 
(см. рис. 23) величина 0 7 газового потока на входе в первый слой 
катализатора определяется соотношением 

67 = 65 + 0! (IV, 83 ) 

а уравнение теплового баланса 

° 7 * (1) (°) = °-Л 2 к + °р хол (IV, 84 ) 

позволяет определить температуру газа на входе в первый! слой 
катализатора 1 

^Увк+б^ход 

I (0) (ІѴ , 85( 

и т. д. 

тлт\ еСЬ г^ далее приняты следующие обозначения: /<‘> (О), ЦП (+(0 ч 
2 ‘ (б), 2 ѵ (т (1) ) начальные и конечные значения температуры и 
степени контактирования для /-го (/ = 1,2, .... 5) слоя катализатора; 
іо. н, Іо. к, і в . н, ів. к — - начальные (индекс «н») и конечные (индекс — 
«к») температуры отдающего, (индекс «о») и воспринимающего (индекс 
«в») тепло потоков в теплообменнике после /-го (/=2, 3, 4) слоя (при- 
нятые обозначения при / = 1 относятся к температурам газовых 
потоков для внешнего теплообменника); / хол — температура газового 
потока и на входе в контактный аппарат. 

При окислении диоксида серы в триоксид объем газа уменьшается, 
т. е. реакция (IV, 73) идет с уменьшением объема. Поэтому коли- 
чество газовой смеси, поступающей в теплообменники из слоев ката- 
лизатора, определяется по формуле 


і — 2, 3, 4, 


=6 [і--2- а2 ( '>(*<0)] 

- О Г I 1- аг (5 > (і< 5 >^ 


6 <'> 


(IV, 86) 
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где Оо 0 — поток газа, отдающего тепло в (-том теплообменнике. 
Количества газа в потоках, воспринимающих тепло, и их начальные 
температуры также определяются из уравнений материального и 
теплового балансов. Так например, равные температуры на входе 
в теплообменники после 3-го и 4-го слоев (в 4) н определяются из 
следующего соотношения теплового баланса: 

(°6 + °10) = Оіі^к + °12*хол (IV, 87) 

Математическая модель контактного аппарата, содержащая мате- 
матическое описание слоев катализатора (IV, 74) — (IV, 78), тепло- 
обменников (IV, 80) — (IV, 82) и связей между отдельными элемен- 
тами контактного узла соотношения, аналогичные выражениям 
(IV, 83), (IV, 84), (IV, 87) позволяет рассчитывать стационарные 
режимы аппарата при различных значениях его конструктивных и 
технологических параметров. КЦ 

Формулировка задачи оптимизации. В качестве критерия опти- 
мизации стационарного режима контактного узла принята степень 
контактирования во всем аппарате г< 5) (т< 5 >). Определение оптималь- 
ного режима, обеспечивающего максимально возможное значение 
г< 5 > (т< 5 >), ведет к более полному использованию сырья и снижению 
выбросов непрореагировавшего сернистого ангидрида в окружающую 
среду. В качестве варьируемых переменных а к (к = 1, 6) при- 

няты расходы газа в узловых точках разделения потоков, выраженные 
в долях газовой нагрузки аппарата: 

а к == С к /0 к = 1, .... 6 (IV, 88) 

Таким образом, задача оптимизации стационарных режимов контакт- 
ных узлов сернокислотного производства заключается в определении 
значений а к , позволяющих реализовать такие значения температур 
№ (0) газа на входе в слои катализатора, которые обеспечили бы 
достижение максимальной степени контактирования во всем аппарате 
при существующих значениях газовой нагрузки О, концентрации а 
сернистого газа в исходной газовой смеси, состоянии катализа- 
тора и конструктивных параметрах 2 слоев катализатора и тепло- 
обменников. Следовательно, максимизируемая функция имеет вид: 

г (5) (7 (5) )«* / («А, О, г) (IV, 89) 

На варьируемые переменные а к наложены ограничения 

(Йй)тіп ^ 52 (Йй) гаах к = 1 , . . . , 6 (IV, 90) 

и дополнительные ограничения (IV, 91), имеющие следующий смысл: 


Описываемое 

Ограничение условие 
б 5 ^а 2 ... Сц >- О 

йі + а 2 + а 3 ^ 1 ... Оі2 > О 


(IV, 91) 


Н5 


Ранее было отмечено, что контактные узлы сернокислотного про- 
изводства (см. рис. 23, 24) содержат обратные связи по теплу между 
реакционной смесью и исходным газом, т. е. представляют собой 
замкнутые химико-технологические системы. Как показано в работах 
ша, «о], наличие в схемах контактных узлов обратных тепловых 
потоков может привести к появлению неустойчивых режимов при 
определенных значениях параметров. При этом условия баланса по 
веществу и теплу в разрывах обратных потоков, выполнения которых 
обычно достигают при проведении итерационного расчета схемы отно- 
сительно переменных в «разрывах», целесообразно перенести на уро- 
вень оптимизации, рассматривая их как ограничения типа равенства и 
считая переменные в разрывах дополнительными варьируемыми 
переменными [см. задачу 4, выражения (I, 79)— (I, 81)]. Это позво- 
ляет в каждой точке расширенного пространства варьируемых 
переменных, полученной в процессе оптимизации, выполнять расчет 
лишь разомкнутой схемы, и, таким образом, избежать при выполне- 
нии вычислений появления нежелательных «нулевых» режимов и 
неоднократной проверки условий неустойчивости. Эти условия доста- 
точно проверить лишь в конечной (оптимальной) точке. Таким обра- 
зом, прием вынесения ограничений в критерий оптимизации (состав- 
ную функцию), позволяет перейти к эквивалентной задаче оптимиза- 
ции для разомкнутой схемы в расширенном пространстве варьипѵе- 
мых переменных. ^ 

Эквивалентная задача (впрочем, как и исходная) представляет 
собой задачу на условный экстремум, для решения которой исполь- 
зовалась условная оптимизация: метод уровней и метод модифициро- 
ванной функции Лагранжа. Для выполнения безусловной минимиза- 
ции составной функции (нижний уровень оптимизации) применялись 
методы квазиньютоновского типа — ЭРР, ВРС5, 55ѴМ [см. (III, 81), 
(111,84)]. Расчет производных минимизируемой функции выпол- 
нялся как «аналитически» — с привлечением сопряженного процесса 
18, с. 142], так и методом конечных разностей, что позволило про- 
вести сравнение результатов оптимизации по эффективности и точ- 
ности решения *. 

В принятой модели контактного узла каждый поток характеризу- 
ется тремя величинами, вычисленными в данном сечении потока: 
(а, і, г\, где а величина (объемный расход) потока, выраженная 
в долях газовой нагрузки на аппарат; I — температура; г — степень 
превращения 50 2 в З0 3 . Слой катализатора обладает одним выходным 
потоком, параметры г и I, которого изменяются в соответствии с урав- 
нениями (IV, 74), (IV, 75), и одним выходным, при этом относитель- 
ная величина потока считается неизменной в процессе интегрирова- 
ния. Смесители газовых потоков обладают соответственно двумя 
входными и одним выходным делителем газовых потоков — одним 
входным и двумя выходными потоками. Для каждого из указанных 
трех элементов схемы зависимость параметров выходного потока от 


* Разработка версии программы для ЭВМ, включающей сопряженный процесс, 
выполнена Коноплевой А. Ю. * н 
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входных значений (уравнения модели) может быть задана в векторном 
виде: 

У = ! (х, и) (IV, 92) 

где у — выходные значения параметров {а, і, г\; х — входные 
переменные; и — варьируемые переменные (они появляются лишь 
в уравнениях делителей и имеют смысл коэффициентов деления пото- 
ков). Теплообменник обладает двумя входными потоками (отдающий 
и воспринимающий тепло) и, соответственно, двумя выходными. 
Согласно уравнениям (IV, 80) — (IV, 82) связь между его входными 
(х) и выходными (у) параметрами записывается в виде неявной функ- 
ции: 

Ф ( х , у) = 0 (IV, 93) 

так как при расчете коэффициента теплопередачи используются 
значения теплофизических свойств газов, вычисленных при некото- 
рых «средних» значениях температуры. 

Принятый здесь подход к расчету процесса контактирования 
в последовательных слоях катализатора заключается в расчете про- 
цесса, протекающего в одном «эквивалентном» слое. Последний 
представ'ляется в виде совокупности подслоев, в которой объединены 
данные слои контактной массы со своими характеристиками. При 
расчете «эквивалентного» слоя изменение параметра а в каждом под- 
слое и в промежуточных потоках между его подслоями не учитыва- 
ется, так как эффект изменения объема реакционной смеси представ- 
лен кинетическим уравнением (IV, 74), а влияние промежуточных 
теплообменников проявляется в скачкообразном изменении темпе- 
ратуры на границах раздела подслоев. Уравнения «сопряженных» 
блоков для элементов (IV, 92) имеют вид: 

ѵ=ТіІ ( ІѴ ’ 94 > 

і 

где X, [х — сопряженные переменные, представляющие соответ- 
ственно, вход и выход «сопряженного» элемента. Для каждого слоя 
частные производные его выходных величин (Т, г) по входным пара- 
метрам определяются, как результат интегрирования соответствую- 
щей системы уравнений в вариациях, которое выполняется одновре- 
менно с интегрированием основного уравнения (IV, 74) вместе с урав- 
нением (IV, 75). Аналогичный вид имеют уравнения блоков, «сопря- 
женных» с системой уравнений (IV, 93); при этом частные производ- 
ные правых частей блоков (IV, 94) вычисляются дифференцированием 
неявной функции (IV, 93). 

Расчет сопряженного процесса, содержащего блоки (IV, 94), 
выполняется в «обратном» порядке по отношению к порядку расчета 
элементов основного процесса. Необходимые «начальные» значения 
для сопряженных переменных X (на входе «сопряженного» процесса и 
в «разрывах», соответствующих «разрывам» основного процесса) 
определяются частными производными минимизируемой (составной) 
функции по соответствующим переменным основного процесса. 
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Некоторые из параметров {а, і, г] определенных потоков схемы 
зависят лишь от значений параметров входного потока контактного 
узла, которые предполагаются фиксированными. Это обстоятельство 
явно учитывалось при вычислении производных д[ ь /дх } для уравнения 
(IV, 94); некоторые из них полагались тождественно равными нулю. 

Заметим, что присутствие дополнительных технологических огра- 
ничений (например, на выходную температуру первого слоя), пред- 
ставляющих собой ограничения на промежуточные переменные си- 
стемы, приводит к появлению соответствующего «штрафного» члена і 
в составной функции. Расчет производных критерия, содержащего ! 
явную зависимость от промежуточных переменных системы, связан 
в этом случае с несколько видоизмененной формой системы (IV, 94), 
описывающей сопряженный блок: в ее правую часть вводится свобод- 
ный член — производная критерия по соответствующей промежуточ- 
ной переменной. 

Наконец, следует отметить, что в реальных условиях устойчи- 
вость режима контактного узла достигается путем определенного 
увеличения объема контактной массы в слоях контактного аппарата. 

Тем самым создается, так называемый, запас катализатора, причем 
условия неустойчивости процесса, о которых говорилось ранее, 
оказываются заведомо невыполненными [86]. Устойчивый ход 
процесса окисления зависит, главным образом, от величины запаса 
катализатора в первых двух слоях контактного аппарата и связан 
с поддержанием в этих слоях определенного режима контактирова- 
ния, при котором значения степеней превращения диоксида серы 
в триоксид на выходе каждого из них оказываются практически равно- 
весными. В этом случае условие устойчивости процесса может быть 
учтено в алгоритме оптимизации как ограничение на величину 
(коэффициент) запаса катализатора в данном слое, значения которой 
не могут быть менее заданной. Введем время контакта в слое — отно- 
шение объема контактной массы к объемной скорости газового потока 
через слой. Тогда коэффициент запаса слоя можно представить в виде 

т = т/т (IV, 95) 

где т полное время контакта в слое; т ■ — «момент» времени кон- і 
такта, при котором величина степени превращения диоксида серы 
достигает (с точностью е) своего равновесного значения, т. е. 

0 ) (*о, Т) = 2 р — 2 (х 0 , т) = 8 (IV, 96) 

где г 0 — определяется выражением (IV, 77), а х 0 = {а, I, г} — пара- 
метры газового потока на входе в слой. Принимая, что коэффициент 
запаса есть выходная переменная слоя, приведем выражения для его 
производных по входным параметрам данного слоя, необходимые по 
уравнению (IV, 94) для формирования сопряженного процесса. 

В соответствии с соотношением (IV, 77) величина г р является 
функцией константы равновесия К р (при фиксированных а , Ъ), 
известным образом зависящей лишь от температуры і в данном сече- 
нии слоя. В свою очередь і зависит от г (х 0 , т) и х 0 [см. выражения ^ 

(IV, 75)]. Таким образом, г р = г р (х 0 , т). Соотношение (IV, 96, \ 
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Таблица 25. Оптимизация контактнбгб узла (см. рис. 23) 
при О = 65 000 м 3 , 650 , = 7,5 % 


Подход к условной 
оптимизации 

БРР 

55ѴМ 

враз 

Метод модифицированной функции Ла- 

97,91 % 

97,87 % 

97,83 % 

гранжа 

192; 58,3 

200; 73; 4 

217; Ы\ 3 

Метод «уровней» 

97,90 % 

97,90 % 

97,84 % 


208; 58; 2 

199; 61; 2 

198; 55; 2 


определяет т как неявную функцию от х 0 , т. е. т = т (х 0 ). Выполняя 
дифференцирование по х 0 тождества ш [х 0 , т (х 0 ) ] = е, нетрудно 
выразить производные дх!дх 0 через да>Ідх 0 и да>/дх, которые могут 
быть легко вычислены с помощью соотношения (IV, 77) и интегриро- 
вания системы уравнений в вариациях для уравнения (IV, 74). 
Искомые производные коэффициента запаса т по входным перемен- 
ным слоя х 0 имеют вид 

дт х дх т д х 

дх 0 ~~ т 2 дх 0 х дх 0 

В табл. 25 приведены результаты расчетов оптимального режима 
контактного узла одинарного контактирования (см. рис. 23) с при- 
менением сопряженного процесса. Каждый результат представлен 
величиной г< 5) (т< 5) ), выраженной в %, и тройкой чисел К/, К Р ,\Кі- 
Подобные расчеты выполнялись ранее [11, с. 180] с применением 
разностной оценки производных (там же приведены все необходимые 
параметры контактного узла). Сравнение этих двух подходов показы- 
вает, что в данном случае использование сопряженного процесса для 
расчета градиента минимизируемой функции сокращает затраты вре- 
мени ЭВМ при поиске оптимального режима в два раза. При этом 
точность определения оптимального режима в обоих случаях при- 
мерно одинакова. 

Минимизация функций при наличии линейных 
ограничений 

При решении задач оптимизации химико-технологических процессов очень часто 
ограничения на управляющие переменные являются линейными. Часто они имеют 
характер простых ограничений на максимальные и минимальные значения соответ- 
ствующих управляющих переменных (1,9). В схемах, как правило, имеются дели- 
тели потоков, на коэффициенты деления которых налагаются линейные ограничения 
вида (1,7). Особенно много таких ограничений будет в задачах синтеза при приме- 
нении метода структурных параметров (см. гл. VI). Конечно, для решения задачи 
оптимизации с линейными ограничениями, можно использовать общие методы, 
разработанные для случая произвольных ограничений. Однако этот случай можно 
рассматривать отдельно по двум причинам. Первая из них состоит в том, что в зада- 
чах, где имеются только линейные ограничения, удается построить более эффектив- 
ные алгоритмы, используя линейный характер ограничений. Вторая причина со- 
стоит в следующем. Математические модели отдельных аппаратов часто могут рабо- 
тать только в некоторой допустимой области. Скажем, если во время оптимиза- 
ционной процедуры концентраций какой-либо компоненты на входе реактора примет 
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Рис. 25. Пример поисковой траектории. 


/ / ' / отрицательное значение вследствие несовер- 

/ шенства применяемого метода оптимизации, 

/ < то математическая модель, реактора, не 

рассчитанная на такой физически нереаль- 
ный случай, может перестать работать. 
Причем часто допустимая область задается 

1 ________ линеиными ограничениями. В то же время 

/ Х„ п ри использовании общих методов во время 

X поиска ограничения могут нарушаться, что 

У' может привести к прекращению поиска. 

Увеличивая штрафные коэффициенты, можно 
добиться уменьшения нарушения ограниче- 
ний, но это приводит к ухудшению харак- 
теристик сходимости. В то же время при использовании методов, рассчитан- 
ных на учет линейных ограничений, удается достаточно точно удовлетворять их 
Рассмотрим методы, в которых аппроксимируется обратный гессиан Итак' 
рассмотрим задачу: ' ’ 

тіп/(х) (IV, 97) 


п 1 х — ь і = и < = 1, т (п\п і = 1) (IV, 98) 

яТх — й.гнсО і = т+1 р (IV, 99) 

В процессе поиска некоторые из ограничений — неравенства (IV 99) — могѵт 
стать строгими равенствами. Эти ограничения будем называть активными. Обозна- 
чим через^ ? , (^ т) линейное многообразие, образованное пересечением а гипео- 
т? С шг\ ТеИ ’ К0Т °Р Ь,Х т являются гиперплоскостями, описанными уравнениями 
(IV, Уй), а (? — т) — гиперплоскостями, соответствующими (а — т) активным 
ограничениям (IV, 99). Совокупность т ограничений (IV, 98) и всех активных огра- 
ничении в данной точке списка будем называть базисом. 

Во время поиска изображающая точка может двигаться в поисковом простран- 
стве внутри некоторого многообразия (д ^ /л), может входить на новые гипер- 
плоскости, соответствующие активным ограничениям (увеличение базиса) или на- 
оборот, сходить с некоторой гиперплоскости (уменьшение базиса). В качестве при- 
мера на рис. 25 изображена поисковая траектория в трехмерном пространстве при 
наличии одного ограничения типа неравенства (IV, 99), причем допустимая область 
находится ниже плоскости І х . Поиск начинается в точке А. Участок траектории А В 
лежит в полном пространстве (базис пустой). В точке В поисковая траектория 
пересекает плоскость і] и в дальнейшем лежит в этой плоскости. Здесь уже имеется 
одно активное ограничение (базис состоит из уравнения плоскости /.,). В точке С 
поисковая траектория сходит с плоскости и далее участок траектории Сй уже 
лежит в полном пространстве. Отсюда ясно, что любой алгоритм, осуществляемый 
в соответствии с формулами (1,39), (1,41), должен содержать следующие основные 
алгоритмы. 

1. Алгоритм движения при неизменном базисе. Этот алгоритм в свою очередь 
должен состоять из трех частей. Первая часть — алгоритм определения матрицы 
в ііі в выражении (1,41), при неизменном базисе; вторая часть — определение шага 
вдоль поискового направления и третья часть — критерий схода с активного огра- 
ничения. к 

чений' ^ ЛГ0 Р И ™ изменения матрицы Н( при увеличении числа активных ограни- 

3. Алгоритм изменения матрицы Н { при уменьшении числа активных огра- 
ничении. р 

Вначале выведем некоторые вспомогательные соотношения для случая когда 
имеются ограничения только типа равенств 


К л < = О 


і = т + 1 , 


п]х - Ь і = О 


і = 1 , <?, д > т 


(IV, 100) 


і 



Пусть Ыд = {п и ..., Пд) ( п X (?)-матрица, столбцы которой образованы векторами 
пі, (і 1, ?). Будем считать, что ее ранг равен <7. Алгоритм движения надо строить 
таким образом, чтобы поисковые направления рі лежали внутри линейного много- 
образия 1*д і образованного пересечением гиперплоскостей (IV, 100). Другими сло- 
вами, должны выполняться соотношения 

р\п { = О А = 0, I, . . . і=--ТГя (IV, 101) 

Очевидно, этого можно достигнуть, образуя направления по формуле 

Рі = -Рд§і (IV, 102) 

где Рд — матрица ортогонального проектирования (III, 38) 

(ІѴ ’ 103) 

Направление р; в данном случае является проекцией градиента функции на пере- 
сечение гиперповерхностей (IV, 100) и дает направление наискорейшего убывания 
функции в многообразии Ьд. 

Ясно, что в точке минимума х должно выполняться соотношение: 

Рд§С*)= 0 (IV, 104) 

Умножив выражение (IV, 103) на § (х) и использовав соотношения (IV, 104), получим 

8 (х) = Ыду (IV, 105) 

где у = (дЛЛ^) _1 N ^2 (х) — вектор, компонентами которого являются множители 
Лагранжа. Если вектор у рассчитывается не в точке минимума, а в текущей точке Хь. 

Г = №)~‘Л^ (IV, 106) 

то его компоненты называются оценками первого порядка множителей Лагранжа. 

Формула (IV, 102) лежит в основе метода проектирования градиента [88, с. 134— 
135]. Ясно, что по скорости сходимости этот метод эквивалентен методам градиента 
и наискорейшего спуска для случая отсутствия ограничений. Поэтому методы пере- 
менной метрики, дающие большую скорость сходимости, интересно распространить 
на данный случай. 

Предположим вначале, что матрица А [см. выражение (III, 2)] известна и имеет 
ранг п. Поставим следующую задачу — пусть координаты точки X; удовлетворяют 
уравнениям (IV, 100); необходимо найти точку минимума функции (III, 2) в много- 
образии Ьд. 

В точке минимума вектор § (х) должен быть ортогонален Ь д . Считая, что точка 
Х{ + і соответствует точке минимума, подставим в соотношения (III, 8) §; +1 = Nда, 
где а — некоторый вектор, координаты которого надо найти. Умножив обе стороны 
этого равенства на А" 1 , получим: 

х і+ 1 — х і = А~ 1 (Д^а — §;) (IV, 107) 

Поскольку вектор з і = х-^ — х с С Рд< ДЛ^. ф 0; отсюда, умножив равенство 
(IV, 107) на ДЛ слева, получим 

- АЛ/ГѴ/ =■ 0 (IV, 108) 

Поскольку ранг Ыд равен </, и ранг А" 1 равен п, существует матрица, обратная 
к матрице Л/^А^Л^ [89], поэтому из уравнения (IV, 108) получим 

а = (Л^А- 1 ^)- 1 Л^А- 1 *, (IV, 109) 

Компоненты вектора а называются оценками второго порядка множителей Лаг- 
ранжа. Подставив это значение а в равенство (IV, 107), получим [89]: 

х і+ 1 — х і — Р дА г §і 


(IV, ПО) 
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где Р д — обобщенный проекционный оператор 

?<! = ! п — А ~ ІМ д(Н т ч А~ 1 М д )~ 1 (IV, 111) 

Если рассматривается случай минимизации неквадратичной функции и воз- 
можно вычисление гессиана О функции /, то на основе формулы (IV, ПО) может быть 
построен аналог метода Ньютона для случая условной минимизации с линейными 
ограничениями. В этом случае итерационные формулы примут вид 

х к+і= х к-Р Ч 0Г 1 8к (IV, 112) 

где 

В случае отсутствия ограничений формула (IV, 112) сводится к обычной формуле 
метода Ньютона. Рассмотрим теперь матрицу 

/„ - ны д (я^яя,)- 1 Я$ (IV, 1 13) 

где Я произвольная матрица, ранг которой больше или равен < 7 . Матрица Р а 
получена формальной подстановкой в выражение (IV, 111) матрицы Я вместо А~\ 

Покажем, что выполняются соотношения 


Действительно 


п]Рд = О 


(IV, 114) 


М 1 Р я = К~ № М я) №^)~’ К 


і О 


Рассмотрим частный случай формулы (IV, 113), когда матрица Ы а состоит из одного 
столбца Пд\ 


Рі = Іп 

Введем в рассмотрение матрицу Р 

Р = Р г Н = Я 


лад 

п 1 Нп я 

НПдП^Н 


П ]НПд 


в которой матрица Я удовлетворяет соотношениям 

Нпі = О 

Матрица Р обладает свойством: 


1 . 9-1 


(IV, 115) 

(IV, 116) 

(IV, 117) 


Рпі= 0 ( = 1, <7 (IV, 118) 

Действительно, умножив выражение (IV, 116) на П{, получим 


Рпі = Нпі ■ 


НПдПуНп,- 


п]Н П д 


= 0 


Для <? это равенство верно в соответствии с условиями (IV, 117), а для і = 
= <7 оно легко проверяется. 

Рассмотрим теперь ряд методов минимизации функций многих переменных 
при наличии линейных ограничений. 

Метод Гольдфарба [89]. Рассмотрим вначале алгоритм движения при неизмен- 
ном базисе. Покажем, что последовательность точек, определяемая формулами 
(I, 39), (I, 41), будет лежать в многообразии Ьд при соблюдении следующих условий: 

1. Начальная точка х 0 ^ Ь д . 

2. Матрица Я; в выражении (1,41) определяется формулой (11,90). 

3. Матрица Р в формуле (II, 90) удовлетворяет соотношениям (IV, 118), а коэф- 
фициенты с кі , йы — соотношениям 



Доказательство проведем по индукции. Рассмотрим вначале первый шаг (і — 0). 
Из соотношений (IV, 1 18) и (11,93) получим: 




= 0 К%п.. = п, т= 1,2 1 = 1, 9 (IV, 120) 


отсюда, вектор р 0 = —Щ§о ортогонален векторам л* , (* = 1, Я ) • Следовательно 
все точки полупрямой, начинающейся в точке х 0 , (х 0 С Ь д ) и проходящей вдоль 
вектора ро> будут принадлежать Ъц. В частности точка ^ ьц. 

Рассмотрим (і ”р 1)*й шаг. Пусть выполняется соотношение 


я Л . = 0 


*?»/ = »/ 


1,2 1=1, д (IV, 121) 


и точка Хил С Ь а ■ Покажем, что х і+2 € Ьд- Умножив справа равенства (11,90), 
(11,91) на п } и использовав выражения (IV, 119), (IV, 121), легко получить равен- 
ства 


#Н-1 п / = 0 


К 


И-1 п і 


-1/ 


т= 1, 2 


І = С Я 


Отсюда, вектор будет ортогонален векторам 


V 


(IV, 122) 
(І=~Я)- 

Следовательно, все точки полупрямой, начинающейся в точке *;+і и проходящей 
вдоль вектора р г+1 , будут принадлежать Ьд. В частности х і+2 6 V Таким обра- 
зом, все точки **> (1 = 0, 1, ...) лежат в Ь д . Матрица К может быть определена 
с помощью формулы (IV, 116). _ с „„„„„„„ 

Теперь покажем, что для любой формулы семейства Хуанга (Ш, 9э) условия 
(IV 119) будут выполняться. Действительно, в этом случае коэффициенты см, аы 
определяются по формулам (III, 100), (III, 101), и соотношения (IV, 119) примут вид 


“/^Л+Р/А=°- ЪіУ Т і Н і Ы я 


(IV, 123) 


В точке х 0 эти соотношения являются следствием условия (IV, 118). Пусть в і-той 
точке они выполняются: покажем, что они будут выполняться в (і ~г 1)-и точке. 
В і-той точке выполняются условия (IV, 121), поэтому = 0, а = 0 (напра- 

вление движения в і-той точке лежало в Ьд), что и доказывает тождество (IV, 123). 

Направления р г строятся с помощью формулы (1,41), в которой Ні удовлет- 
воряют уравнению (11,32), следовательно, эти направления будут сопряженными. 
С другой стороны, как мы показали, все векторы р; будут лежать в многообразии Ьд 
размерности п — ц. Отсюда (см. с. 82), минимум в многообразии Ьд будет найден 
за число шагов, не большее, чем л — ц. В дальнейшем матрицы Н ( , которые обеспе- 
чивают движение в Ьд, будем обозначать через НЧ. Нижнии индекс здесь по-преж- 
нему обозначает номер итерации, а верхний — число линейных ограничений, обра- 
зующих линейное многообразие Ьд. 

Остановимся теперь на алгоритме выбора шага вдоль направления Рі . Оче- 
видно, шаг вдоль направления рі должен быть меньше или равен расстоянию от 
точки Хі до ближайшего неактивного ограничения. Легко видеть, что точка пере- 
сечения луча, исходящего из точки х* по направлению р* [см. формулы (I, 41)], 
с некоторой гиперплоскостью 


П^- Ь д 


= 0 


д > т -ф 1 


(IV, 124) 


определяется значением коэффициента щ 

Ь„ - 


ССіп ' 


— 1 

т 

п Ѵі 


где 


П дРі 


(IV, 125) 
(IV, 126) 


Найдем величину 

а і = тіп а 
я 

Отсюда коэффициент щ в выражении (1,39) надо выбирать в соответствии с фор- 
мулой _ , 

“ если а,-> а * (IV, 127) 

если а і < а? (IV, 128) 
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а г = 


где а?— значение а., соответствующее оптимальной точке на направлении р 
Ясно, что если выполняется условие (IV, 127), то базис ограничений остается без 
изменении, если же выполняется условие (IV, 128), то в базис вносится ограничение 
номером /, для которого ац = щ, т. е. уравнение той гиперплоскости, на которую 
попадет изображающая точка в результате итерационного шага (I 39) Гипеппло- 
скость с номером / удаляется из базиса, если в і-той точке выполняется неравенство 


где 


н иі N т чі ь й 112 


(IV, 129) 


Ѵ/*/ ; 1/2 =тах( ѵ .6т: 1 / 2 ), 


і = т + 1 , 


■ множители 


Здесь в Ь {і і'-тый диагональный элемент матрицы (Я Т Я V 1 ; ■ 

Лагранжа [см. выражение (IV, 106)]. Ѵ 4 4 

числа Активных 17 Р Тн™шъ“ ИЯ МаТР ' ЩЫ " ПРН уВеЛИЧешш » Уменьшении 
„„„ п Р е Д П0Л °жим что базис одновременно может увеличиться только на одно актив- 
"° я е ,° ГРа ” ИЧеНИе ( малове Р оя ™°. что изображающая точка во время поиска может 
9 ^ пасть на пересечение двух гиперплоскостей, соответствующих активным 

ограничениГ^™^ ПуСТЬ Д ° « екото Р ой точки х к базис состоял из д - 1 линейных 
ограничении, векторы нормалей к которым образовали матрицу Я 0 , а в этой 

точке к базису должно быть добавлено уравнение гиперплоскости (IV ’ 124) Пусть 
до точки х к было проведено * - 1 итераций. Точка х к лежит на прямой, проходя- 
щей вдоль вектора р А _, * -НЦ\^ Ѵ Как было показано, чтобы поисковые 

*^мѵлГлГіП 7 Г.Ѵ° М0ЩЬЮ Ф ° РМ ^ Л (І>39) ,’ (І ’ 41) ' в К0Т °Р ЫХ Н і вычисляются по 
ф рмуле (II, 107), лежали в многообразии І я , необходимо, чтобы матрица Д удо- 

влетворяла условиям (IV, 118). Образуем матрицу Я в соответствии с форм/лой 

(IV, 116), в которой Я взята равной Н«-\. Обозначив матрицу 7? через Я*, получим 


Я» = Я = щ-\ - 


ні 






(IV, 130) 


117), 


Поскольку матрица Я|:} удовлетворяет соотношениям (IV, 117), матрица Н ч 

?Тп 1 тДТм е 7 п? Я І 9 оГ ТН ° ШеНИЯМ (ІѴ ’ П8) - ПуСТЬ на ''- той ««рации в соответствии 
с критерием (IV, 129) ограничение, имеющее номер д , должно стать неактивным 

следовательно, из базиса следует удалить уравнение 9 -ой гиперплоскости. Матрицу 

Щ предлагается изменять по формуле: 


ЯГ 


Я? + 


УіѴХ-і 


(IV, 131) 


Р< !- 1 ~ проекционная матрица, соответствующая оставшимся активными 
ограничениям. Если /(х) является квадратичной функцией, рассмотренный алгоритм 
^петат радение 3аДа ™ (!Ѵ, 97)-(ІѴ, 99) за конечное число итераций. Чи™ 

ппименения У этп б ° ЛЬше как это был0 в случае безусловной минимизации. Для 
ИЯ Э ° Г0 алго Р итма в случае минимизации неквадратичных функций его 
едует дополнить некоторыми операциями, близкими к тем, которые применялись 
аналогичном случае в задаче безусловной минимизации (например, процедурой 
«обновления» матрицы НЯ в некоторых ситуациях, и др.). 

Отметим, что для преобразования матриц НЯ может быть использована любая 

ГолмЛяпбя Се іЯ 9 Й і 7 В п Хуанга ( ПІ > 95 )- а не только преобразование ОРР (см. работу 
ольдфарба [89]). Остановимся теперь на недостатках метода Гольдфарба. Пусть 

до точки х к (см. рис. 25, точка В) поиск шел во всем пространстве, а начиная с этой 
точки он должен поити в многообразии 7- г Матрица Я», полученная в этой точке 
удовлетворяет уравнению (11,32). Ясно, что матрица Щ, полученная с помощью 
выражения (IV, 130), не будет решением системы (II, 32), следовательно, информация, 
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содержавшаяся в Н\ относительно гессиана функции / (х) в результате преобразо- 
вания (IV, 130) будет искажена. Аналогичным образом, преобразование (IV, 131) 
будет искажать информацию о гессиане функции / (х). 

Метод Муртага — Саджента. Отмеченные недостатки метода Гольдфарба связаны 

с тем, что в нем матрица Я* фактически аппроксимирует произведение матриц Р ц (Г к 
[см. выражение (IV, 112)]. Пытаясь избавиться от этого_недостатка, Муртаг и Сад- 
жент предложили метод [90, с. 88], в котором матрицы Р ц и О ^ аппроксимируются 
отдельно. Этот метод может быть получен, если в формулах (IV, 107), (IV, 109) за- 
менить А' 1 ее аппроксимацией 

*,+і = *і + Н, (К ч а - 8 і) а = №Л) _1 

В данном методе матрицы Я., ) _1 пересчитываются отдельно. Матрица Я ( . 

может пересчитываться с помощью любой из формул семейства (II, 90), (II, 91), 
или (111,95). Отсюда, при изменении базиса информация о гессиане, содержащаяся 
в Н к , не будет искажаться. Однако, метод Муртага — Саджента имеет один суще- 
ственный недостаток, который присущ и методу Гольдфарба. Если ограничение 
(IV, 124) было активно на достаточно большом числе итераций, то в матрице Н к , 
аппроксимирующей О к , будет отсутствовать информация о кривизне / (х) по напра- 
влению нормали к гиперплоскости (IV, 124). Поэтому в точке хі схода с ограничения 
(IV, 124) Я, будет плохо аппроксимировать О/ 1 . 

Квазиньютоновский метод 1-го рода. * Вначале рассмотрим алгоритм преоб- 
разования матрицы Я;, обеспечивающий движение в заданном многообразии. Для 
определенности будем предполагать, что в (/ + 1)-ой точке активными должны быть 
первые (д — 1) ограничения (IV, 100), т. е. что в точке х, +1 должны выполняться 
соотношения (IV, 101). Матрицу Я 7 - +1 будем определять из условия, чтобы она удо- 
влетворяла квазиньютоновскому условию 1-го рода (11,31) в (/ + 1)-ой точке, 
была симметрична и обеспечивала выполнение соотношений (IV, 101). С использо- 
ванием соотношения (II, 56) задача поиска матрицы Я_/ +1 сформулируется как 
задача (111,64), дополненная соотношениями 

в/+і° л < ** Ь і 6,- = -е} +1 Н / п 1 і = 1, <7-1 (IV, 132) 

которые получаются подстановкой в соотношения (IV, 101) формулы для р к , полу- 
ченной из (1,41) и для Яу +1 из (11,56). Проведя вывод, совершенно аналогичный 
выводу формул (111,63), (III, 65), легко получить выражение для П: 


О = 


4—1 

°0т+ ^ 

к = 1 


/ 

УкМ] 

ОкМ, 

м Рь + дЛ 

1 ' 

, Ш 2 

»1«і 

у)Уі ) 


(IV, 133) 


где матрица О 0г определяется с помощью формулы (111,65); М ] . = у^\ 

О к = 8 1+ іп1 + л*в/+і V* = У] (в/+і«* + я**/+і) У, (IV. 134) 

Множители Лагранжа рь, соответствующие условиям (IV, 132), находятся решением 
системы линейных уравнений: 

у— 1 

_2ук „т ЛА „ 1 „Т 


ё И ^Ог 




н 


к = 1 




і) і - -г- «/+.о»«л - 


у)у, 


- - 4 — Я/ -и м Рк п і + «Г/+1 °к п і = ь і ( ІѴ > 135 ) 

У]У] 

Рассмотрим общий алгоритм решения задачи (IV, 97), (IV, 99). Пусть в /-той 
точке базис состоял из (д — 1)-го линёйного ограничения, а в (/ + 1)-ой точке в ба- 


* Раздел написан совместно с Е- М. Михайловой, 
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зис добавилось одно ограничение, номер которого д. Эго значит, что условия (IV 132} 
удут дополнены условиями §] +1 Оп д = Ь ц , и тогда в выражение (IV, 133) для Я 

биваетсГизТлпТия’ и С0 ° тветств У ю ЩИЙ этому условию. Поскольку матрица Я вы- 
іт ’ бЬІ 66 Н °?. Ма ф Р° бени У са была минимальна, то можно ожи- 

дать, что информация о гессиане функции / (х), содержащаяся в матрице Я- в мя 

“о" СТ Г Г НИ С ? х Р анится в матрицѣ 4 +1 Д Аналогичная^ ^ ситуаций’ буде" 
и в точке X!, где линейное ограничение (IV, 124) должно быть выведено из базиса. 

этой точке условие ^Ял^ = Ь д должно быть удалено из соотношений (IV 132). 

ин *УАм, СЛуЧае также и в мат Рице Я, должна в максимальной степени сохраниться 

ниЙие (Гѵ ЖЖ К0Т ° РаЯ Соде Р жалась в матрице Я,.,. Конечно, ^и огра- 
ничение (1Ѵ,124) было активно на достаточно большом числе итераций то в матрице 

Н иі (так же, как и в случае применения методов Гольдфарба и Мѵвтага Тят 

° кривизне / (*) вдоль "воДІГ'к „ё? 
Кыиип™! (1Ѵ ’ 24) ‘ Однако в этом случае можно поступить следующим образом 
значение градиента функции Г М в некоторой точке, находящейся „ а 
нормали Пд и после этого подсчитаем величину ѵ к находящейся на 

= 8 ( х к + Ь.Пд) — § (х к ) 

где к некоторый скаляр. Рассмотрим теперь соотношение 


= НПд 


(IV, 136) 


Ясно, что оно содержит информацию о кривизне функции ( (х) вдоль норма ли п 

о АрмТзне функции ^ вааиньютоновское Условие (11,31) содержит мало информации 
™.,!г^ и3не /м? и Л.Аз^ вдоль нормали к гиперплоскости (IV, 124) то наоялѵ с гп 
°” ИЯМИ ^ ІѴ ’ ^ добавим к задаче (111,64) условие (IV, 136) Решив Р получен 
о У кривизне У Ѵ(Ѵ) вГГ ВИД матрицІ І Я *’ которая будет содержать информацию 
^ Д нормали пд. Следует, конечно, отметить, что соотношение 
(IV, 136) получается ценой одного дополнительного вычисления градиента 

У этого подхода имеется еще один недостаток. В его основе лежит формула 
Гринштадта, которая, как показывает опыт решения задач безусловной минимиАя 

( 1П > 64 ) нормой Фробениуса взвешенной суммы (111,76). В этом случае 
выраженАе П для°Я^ П0ЛЬ30ВаННЫЙ ПрИ решении задачи А, 68), можно получить 

^ Рассмотренных подходов имеется один недостаток — на каждом шаге при 
ходится решать систему линейных уравнений (IV, 135), поэтому может оказаться 

ний в ижлой тоА С кА°Лѵле ВаТЬ ИХ Т0ЛЬК0 в “У 486 - когда число активных ограниче- 
лин^ы^ри™ми^ будет мала Размерность системы 

нѵю стппп Н У ѵ Р Пой^Г, (ІѴ ’ 135 )- Правда, указанный недостаток имеет и положитель- 
тт П г1Т! У ' Действительно, решение системы (IV, 135) на каждом шаге гарантирует 
не лярт Ь вект °Р° в Рі нормалям к гиперплоскостям, входящим в базис Р ЧТО 
Г/“ Н0СТИ накапливаться ошибкам округления и приводить к нарушению 

Р«»тс.а“ - иожет п[ю "” д ”" ”1» «дак 


Метод обобщенного приведенного градиента 


Рассмотрим задачу нелинейного программирования (IV, 1) — (IV 4) 
ничения (IV, 4) имеют вид 1 ѵ ’ ’ 


в которой огра- 


а і =5 *=1, П (IV, 137) 

Основная идея метода обобщенного приведенного градиента (МОПГ) [92, с. 49] 

состоит в разделении совокупности переменных х>, (і = Гл) на группу зависимых 

ограничений 3 (?Ѵ С зТ Ы Я переменных - Число зависимых переменных равно р - числу 
ограничении (Іѵ,3). Для определенности в качестве зависимых переменных выберем 
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переменные х 1: ..., х р , в качестве независимых переменных х р _ 1 . 1 х п . Введем 

обозначения: 


Уі = *і 


(‘ = 1. Р) 


-р) (IV, 138) 


Обозначим через у, и векторы с компонентами у и ...,у р , и ъ .... и п _р соот- 
ветственно. Тогда задача (IV, 1)— (IV, 4) запишется в виде 

тіп / (у, и) (IV, 139) 

у, и 


ф« (У, и) = 0 і = 1* р (IV, 140) 

і — І.п — р (IV, 141) 

«І ^ г/г «с Лг і ~ 1 , р (IV, 142) 

При фиксированном и соотношения (IV, 140) могут рассматриваться как система р 
нелинейных уравнений с р неизвестными компонентами вектора у. Будем исходить 
из предположения, что матрица Якоби системы (IV, 140) по переменным у не равна 
нулю. Отсюда равенства (IV, 140) определяют переменные у как неявные функции 
переменных и: у — у (и). Будем теперь искать минимум / как сложной функции 
переменных и 

/*(«; = /[»(«). «Л (іѵ, из) 

Для простоты рассмотрим случай, когда ограничения (IV, 142) отсутствуют. 
Тогда задача (IV, 139)— (I, 141) сводится к следующей: 

тіп / [у (и), и] (IV, 144) 


(IV, 145) 


Отсюда'уже видно основное преимущество подхода, основанного на разделении 
первоначальных переменных на зависимые и независимые; он позволяет во-первых, 
исключить из задачи минимизации ограничения типа равенств; во-вторых, умень- 
шить число поисковых переменных. Правда, при этом возникает новая задача опре- 
деления величин у при фиксированном и. Для решения задачи (IV, 144), (IV, 145) 
необходимо иметь: 

1. Алгоритм определения переменных у как решение системы (IV, 140) при фи- 
ксированных и. 

2. Алгоритм вычисления производных сложной функции (IV, 143) по незави- 
симым переменным. 

3. Алгоритм безусловной минимизации, модифицированный для учета ограни- 
чений (IV, 145). 

Для определения у можно использовать прием линеаризации [92, с. 49]. При- 
меняя правила дифференцирования сложных и неявных функций, легко получить 
формулы для определения производных функции (IV, 143) по переменным и [92, 
с. 49]. Для решения задачи (IV, 144), (ІѴ, 145) используется метод сопряженных 
градиентов, модифицированный для учета ограничений (IV, 145) (МОПГ); он был 
предложен в 1968 г. и является обобщением метода приведенного градиента, раз- 
работанного Вольфом [93] для решения задачи (IV, 1), (ІѴ, 3), (IV, 141) с линейными 
ограничениями (IV, 3), на случай нелинейных ограничений (IV, 3). Вместе с тем сле- 
дует отметить, что при решении задач оптимизации в химической технологии этот 
подход введения зависимых и независимых переменных для исключения ограниче- 
ний типа равенства фактически использовался уже в начале 60-х годов. Причем 
в качестве зависимых переменных обычно выбирались переменные состояния, в ка- 
честве независимых — управления [94], а в качестве ограничений типа равенств 
выступали математические модели блоков и уравнения связи. На основе этого под- 
хода был дан способ вычисления градиента функции (IV, 143) для ряда типовых схем 
[95, 96]. Имеется также более удобный способ вычисления производных функций 
(IV, 143) для общего случая [97]. В чистом виде МОПГ эквивалентен задаче 2 опти- 
мизации ХТС [см. соотношение (1,71), (1,72)], либо задаче 1 [см. соотношения 
(I, 64)— (I, 66)], когда ограничения (I, 10) отсутствуют, 
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Оптимизация процесса полимеризации изопрена 
в производстве синтетического каучука * 


Технологическая схема процесса полимеризации изопрена в произ- 
водстве синтетического каучука состоит из 6—8 параллельно рабо- 
тающих батарей, каждая из которых является каскадом из двух 
непрерывно действующих реакторов с мешалкой (рис. 26). В реакто- 
рах идет процесс полимеризации изопрена в растворе изопентана 
[100, с. 236]. Л ' 


Шихта О (раствор изопрена в изопентане), поступающая в отде- 
ление полимеризации при температуре Т 0 , концентрации изопрена 
т„ и концентрации водорода # 0 , распределяется по работающим ба- 
тареям. В первые реакторы батарей подается катализатор О к , в ру- 
башку реакторов — хладоагент О хл . Выходные потоки всех батарей 
смешиваются и поступают в отделение выделения и сушки. Непро- 
реагировавший изопрен (мономер в возвратной фракции т в ф ) из 
отделения ректификации вновь поступает на вход батарей. Измене- 
ние во времени характеристик реакторов процесса, а также измене- 
ние количества примесей требуют оптимизации стационарного ре- 
жима действующего процесса полимеризации, проводимой через 
определенные промежутки времени. 

В качестве управляющих выбраны следующие 15 переменных 
процесса (число работающих батарей Уд = 6): концентрация изо- 
прена в шихте т а , температура шихты Т 0 , концентрация водорода 
в шихте Н о, на грузка на батарею О 1 , расход катализатора на батарею 

с' к а = і, м б ). 

Математическая модель процесса состоит из совокупности мате- 
матических моделей отдельных аппаратов (реакторов полимериза- 
ции, смесителя и делителя потока) и уравнений связи между ними. 
Уравнения связи здесь очень просты, так что выписывать их не будем. 

В делителе поступающая шихта О разделяется на У б параллельно 
работающих батарей: 


"в 

О = 2 о/ 


где О/ поток на входе /-ой батареи. Естественно, что концентрация 
изопрена в шихте т 0 и температура шихты Т 0 в потоках после дели- 
теля равны соответственно концентрации изопрена и температуре 
входного потока. 

Математическая модель реактора состоит из уравнений тепло- 
и массопередачи, а также зависимостей вязкости (по Муни) полимера 
от режимных параметров процесса полимеризации. В дополнение 
к известной модели процесса [99, с. 16] введены материальный баланс 
по водороду, уравнения смешения для мономера в возвратной фрак- 
ции т в . ф и показателя качества Муни М Г , К готового каучука. При 
записи модели сразу учтем, что выходные переменные г-го реактора 
являются входами в (і -4- 1)-й реактор. 
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Раздел написан совместно с С. Л. Подвальным и Е. М. Михайловой. 



Рис. 26. Схема процесса полимеризации изопрена. 


В статике математическая модель реактора полимеризации (в без- 
размерном виде) записывается следующим образом: 

1 ,6 -у- - т[) - Я[і (т[) = О 

і ,6 -у- - ч) + а Мі Н) + Кл ( г хл - т {) = о 

0{ ді 

ю _3 — «ок.р.-Ьб— = 0, і = і (іѵ, не) 

1 ,6 у- - п{) = 0, і > 2 

1.6-у-К-і- 

- Л^х^, - (х{ - х[_ х )М*‘ = 0 

А/ 

Щ = (9,15-10~ 2 Г( + 1,5) (5,8-0, 185т 0 ) 14,42- 10“ 3 п'. 

/ (т{) = [ 1 - 0,5 (т|/т 0 ) 2 ] т{ 

*Іл = 1.8-%- П - ех Р (— °. 034 2- 4 °/ОІл)] 

= ( т о - т 0 /Ч « °к ,1 о к . р ' 1 °~ 2 / (°' т о) 

Л1*' = а 2 — 0,25x4 — 1 , ЮГ' + (т 0 — 12) + X (Ѵ/С') + ехр (— 0,45т 0 я{) 

где т(- — концентрация изопрена; Т[ — температура; п\ — концен- 
трация катализатора; Н{ — концентрация водорода; М[ — вязкость 
по Муни; Гхл — температура хладагента; Сі л — расход хладагента; 
V — объем реактора; п он . р — концентрация катализатора в ката- 
литическом растворе; іо , 5 — период полупревращения; Бі -до- 
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зировка катализатора. Нижний индекс і (і = 1, 2) у всех перемен- 
ных обозначает номер реактора, а верхний / (/ = 1, Ы б ) — номер 
батареи. Поскольку модель не отражает влияния примесей на выход- 
ные переменные реактора, то требуется подстройка модели. На- 
строечными параметрами при этом являются а и а 2 , Ы (/ = 1, А т б ). 

Уравнения математической модели реактора при заданных значе- 
ниях входных и управляющих переменных представляют собой си- 
стему из 5-ти уравнений с 5-ю неизвестными. Решение этой системы 
проводилось методом Ньютона. Благодаря хорошему начальному 
приближению на расчет реактора в среднем требовалось 2 — 3 ите- 
рации. 

Математическая модель смесителя имеет вид: 

* б 

2 а ' т 2 2 а '4 М 2 

т в.ф. = -щ — М Ѵ . К . : ^Ц і- 

2 ^ [ і — ( т о т 0 ■ іо 2 ] 2 оі 4 

/=і /= і 

где т в .ф — концентрация мономера в возвратной фракции; М г . к — 
вязкость по Муни готового каучука. Поскольку получаемый каучук 
должен обладать определенными свойствами, среди которых одним 
из основных является Л4 Г . К , в качестве критерия оптимизации может 
быть выбрано квадратичное отклонение от заданного качества: 

к = (М г . к - М^ К ) 2 /(М^ К у (IV, 147) 

где Мг *‘ к — заданное значение вязкости по Муни при соответствую- 
щем ограничении на производительность батарей Р. В том случае, 
когда вязкость по Муни задана не жестко, а в каком-то интервале, 
задача оптимизации решается по критерию максимума производи- 
тельности работающих батарей: 

"б 

р = 2 («о- т г) • 10-2 (IV, 148) 

і=і 

В задаче оптимизации должны выполняться ограничения типа (I, 9) 
на следующие входные и выходные переменные схемы т 0 , Т 0 , # 0 , Ѳ, 

Оі, п, Кроме того, должны выполняться следующие ограниче- 
ния 

"б 

2 О 1 = О Т\ = Т{ 1=2,Ы б (IV, 149) 

1=1 

При использовании критерия (IV, 147), надо учитывать ограничение: 

т г.Ф^ т в.Ф^ т в*Ф (IV, 150) 

Причем, можно показать, что верхнее ограничение приблизительно 
эквивалентно ограничению на производительность, а нижнее обеспе- 
чивает недопущение формирования застойной зоны в реакторе и за- 
растания трубопроводов. При использовании критерия (IV, 148) 
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Рис. 2 1 . Зависимость разностной аппроксимации 
производной от величины приращений аргумента. 


в соотношении (IV, 150) остается только 
нижнее ограничение и добавляется 
ограничение по Муни: 

Мг*.к^Мг. к ^М- (IV, 151) 

Итак, задача оптимизации ста- 
ционарных режимов процесса поли- 
меризации формулируется следующим 
образом: требуется определить такие 
значения управляющих пере менны х 
процесса (т 0 , Т 0 , Н 0 , С <У к , / = 1, Ѵ б ), 
которые минимизируют (максимизи- 
руют) один из критериев (IV, 147), 

(IV, 148) при соблюдении упомянутых 
ограничений на входные и выходные переменные. Вследствие малости 
интервала, задаваемого ограничением (IV, 150), величина т в . ф меняет- 
ся незначительно и в первом приближении (при оптимизации схемы) 
рецикл можно не учитывать. Поэтому в дальнейшем изложении (за 
исключением случая, который будет оговорен особо) при оптимизации 
схемы не будем учитывать рецикл. 

Целевую функцию будем обозначать через <3 (х, у), здесь х — 
вектор управляющих переменных, его размерность N ш 3 + 2Ѵ б ; 
у — вектор фазовых переменных, его размерность М = 10А/ б . Про- 
изводные целевой функции вычисляются двумя способами. По пер- 
вому способу производные вычисляются приближенно с помощью 
разностей (1,49). Приращения Ах выбираются из области значений 
Ах, где величина АС}/ Ах практически постоянна (рис. 27). Последо- 
вательность для Ах строится следующим образом: 

Ьх ( р = Дл^-'ѴЮ 1*1, 2, ...; / = ТТЛ (IV, 152) 

Выбираем Ах в середине участка его изменения, где правая часть 
выражения (1,49) принимает приблизительно постоянное значение. 
Так, на рис. 27 кривые (а = 50; 0) зависимости логарифма выраже- 
ния (1,49) от логарифма Ах ъ на участке — 3,5 < 1§ (Ах б ) < — 0,5 
принимают почти постоянные значения, и Лх 5 выбрано равным 
10" 3 х & ; а — коэффициент штрафа. Выбор больших значений Ах при- 
водит к грубой оценке производных вследствие погрешности метода 
конечных разностей. При малых Ах могут искажаться значения про- 
изводных (вплоть до перемены знака) поскольку расчет схемы осу- 
ществляется с некоторой погрешностью. По второму способу произ- 
водные вычисляются с помощью сопряженного процесса [3, с. 142]. 
Время, затрачиваемое на вычисление производных с помощью со- 
пряженного процесса, составляет 1,6^ м (где і м — время расчета ма- 
тематической модели), тогда как при вычислении производных с по- 
мощью разностей эта величина составляет (V + 1) і м . 

6 Островский Г. М. 
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Таблица 26. Результаты 
оптимизации процесса 
полимеризации изопрена 
при двух способах вычисления 
производных целевой функции 
(IV, 181) 



Результаты оптимиза- 
ции, полученные при 
использовании 

Метод 

безусловной 

оптимизации 

конечно- 
разностно- 
го вычисле- 
ния произ- 
водных 

метода со- 
пряженно- 
го процес- 
са 


*/ 




Гаусса — 
Зейделя 

181 

7 

— 

— 

наискорей- 
шего спуска 

100 

4 

25 

4 

ОРР 

80 

3 

20 

4 


Таблица 27. Результаты 
оптимизации стационарных режимов 
процесса полимеризации изопрена; 
критерий оптимизации 
(см. формулу (IV, 181)] 


Метод 

безусловной 

оптимизации 

^орі 

к ! 

К 0 

Г 

я* 



ОРР 

5,281 

185 

21 

6 

Ньютона 

5,280 

173 

18 

5 

Гаусса — 
Зейделя 

5,280 

849 

32 

5 

наискорей- 
шего спуска 

5,280 

601 

69 

8 

сопряжен- 
ных гради- 
ентов 

5,280 

і 

209 

19 

5 


В табл. 26 приведены результаты сравнения двух способов вы- 
числения производных целевой функции [критерий (IV, 147) ]. Ис- 
пользовались следующие три метода безусловной оптимизации: без- 
градиентный Гаусса — Зейделя, наискорейшего спуска и ОРР. При- 
менение метода сопряженного процесса позволяет сократить число 
вычислений целевой функции приблизительно в четыре раза. Для 
учета ограничений использовался метод штрафов, при котором про- 
водилась безусловная минимизация функции (IV, 47) для некоторой 
последовательности значений параметров а к , р*, где г — номер ите- 
рации метода штрафов (г = 0, 1, 2, ...); с4 +І = да к \ р* +1 «г ^$ г к . 
Для ускорения сходимости метода штрафов применялся метод ква- 
дратичной экстраполяции [98, с. 361]. 

Численная процедура решения задачи оптимизации является 
четырехуровневой, причем 1-й уровень представляет собой расчет 
реактора; 2-й уровень — расчет схемы при фиксированных управ- 
ляющих переменных: 3-й уровень — безусловную минимизацию, 
4-й уровень — изменение штрафных коэффициентов. 

В табл. 27 приведены результаты оптимизации стационарных 
режимов процесса полимеризации изопрена при следующих значе- 
ниях параметров: а* 0) = 10; ^ = 5 и приняты следующие обозначе- 
ния: 7?о, Я 0 рі ■ — соответственно начальное и оптимальное значения 
целевой функции; г — число итераций метода штрафов; производные 
вычислялись методом сопряженного процесса. 

Кроме того, проводилась оптимизация схемы с рециклом. Для 
учета рецикла использовались три следующих способа, проиллю- 
стрированные данными табл. 28: 1 — расчет рецикла с использова- 
нием метода простой итерации; 2 — расчет рецикла методом простой 
итерации с использованием приема прогнозирования (11,200); 3 — 
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Таблица 28. Результаты оптимизаций 
стационарного режима процесса 
полимеризации (с учетом рецикла) 


Номер 

способа 

учета 

рецикла 

«і 

К Р 

Г 

Машин- 
ное вре- 
мя, с 

і 

227 

36 

6 

187,1 

2 

216 

33 

5 

97,1 

3 

168 

28 

6 

56,3 


использование подхода, сво- 
дящего задачу оптимизации 
замкнутой ХТС к последо- 
вательности задач оптими- 
зации разомкнутой ХТС 
следующим образом. Соот- 
ношение (11,200) в линейном 
приближении дает решение 
системы уравнений замкну- 
той ХТС. В связи с этим про- 
ведем оптимизацию разомк- 
нутой ХТС, предположим, что концентрация изопрена в рецикле 
вычисляется как явная функция вектора поисковых перемен- 
ных и і+1 с помощью соотношения (II, 200). После того, как будет 
найден оптимум, необходимо при оптимальном векторе поис- 
ковых переменных решить систему уравнений замкнутой ХТС 
и в новой точке заново провести описанную процедуру и т. д. Реше- 
ние задачи проводится по критерию (IV, 148). Из таблицы видно, 
что использование приема прогнозирования позволило уменьшить 
время, затрачиваемое на решение задачи оптимизации, в два раза, 
а использование приема линеаризации — в три раза. 


Оптимизация конструкционных параметров 
теплообменной системы* 


Рассматривается задача оптимизации теплообменной системы (ТС), 
показанной на рис. 28 и являющейся частью схемы некоторого про- 
изводства [102]. ТС состоит из двенадцати теплообменников, двух 
делителей потоков — Ди смесителя С, фиктивных блоков ФБ, от- 
ражающих изменение температуры и давления в других аппаратах 
системы. Аппараты Т-2, Т-7, Т-8, Т-11, Т-12 осуществляют тепло- 
обмен между газом и водой, аппараты Т-3 и Т-4 выполнены в виде 
коробов с пакетами петлеобразных труб внутри, а остальные аппа- 
раты — обычные кожухотрубные теплообменники. Предполагаются 
заданными температуры потоков 77 на выходе ТС, а также общий 
допустимый перепад давления на линиях технологических газов 
Ар* (I), газов среднего давления Ар* (II) и газов низкого давления 
Ар* (III). Для математического описания теплообменных процессов 
был использован метод [103], позволяющий учесть отклонения схемы 
взаимного движения теплоносителей от удельного прямотока или 
противотока. Соответствующие уравнения имеют вид: 


Тхол 


— 7 хол, о + (Т’гор, о — Т хол, о) 
Тгор = ТТор, о 


1 — ехр { — О [1 — о) (1 — 2ф)]} 
1 + со (1 — ф) — (Оф Е 

— (Т ГОР, 0 Т хол, о) ш 


(IV, 153) 
(IV, 154) 


где Т и Т 0 — температуры на выходе и входе соответственно, К; 
Ф — коэффициент, определяющий зависимость характера тепло- 


* Раздел написан совместно с Г. В. Михайловым и В. С. Витковым. 
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т =230,0 
Р— 1215,9 



Рис, 28. Схема системы теплообмена: 

1—43 — номера потоков; Т — теплообменники; Д — делители потоков; С — смеситель; ФБ — фиктивные блоки, отражающие изменение 
давлений и температур в аппаратах схемы, в которую теплообменная система входит как подсистема. 






передачи от схемы взаимного движения теплоносителей [104]; 

ш бхолСрхол ^ 1 
ОгорСргор 

(С и с р — расход и теплоемкость потока соответственно) параметр 
Ъ — кРіІ(О хоя с рхол ). Поверхность теплопередачи Р г — 

(йі — внутренний диаметр труб; / г - — высота труб; — их число; 
і — номер теплообменника). Коэффициент теплопередачи является 
функцией геометрических характеристик, в частности, числа труб 
их длины и шага между ними Именно эти характеристики 
были выбраны в качестве оптимизируемых в рассматриваемой задаче. 


Таблица 29. Начальные значения параметров 
технологических потоков ТС 


№ пото- 
ка (см. 
рис. 28) 

Расход 
м/ч * 

Давле- 

ние, 

кПа -0,01 

Темпе- 

ратура, 

°С 

Концентрации, % (объемн.) 

н,о 

N 2 

о 2 

50, 

50, 

і 

192000 

12,00 

230,00 

0 

79,000 

21,000 

0 

0 

3 

162900 

11,66 

45,0 

1,0000 

78,202 

20,798 

0 

0 

6 

273009 

6,00 

30,0 

100,00 

0 

0 

0 

0 

10 

162400 

1,05 

373,0 

2,7100 

92,475 

3,5500 

1,2650 

0 

13 

132800 

10,15 

65,0 

0 

96,855 

3,1387 

0,0059 

0,0004 

16 

133400 

10,38 

479,4 

0 

96,460 

3,1250 

0,0059 

0,4091 

18 

154100 

10,96 

604,4 

0 

83,473 

3,5650 

1,6850 

11,277 

24 

194000 

4,20 

200,0 

0 

79,000 

21,000 

0 

0 

26 

98998 

1,70 

30,0 

100,0 

0 

0 

0 

0 

28 ** 

98998 

46,000 

104,0 

100,00 

0 

0 

0 

0 

39 

153100 

10,80 

504,7 

0 

84,023 

2,8980 

0,34900 

12,730 

41 

158800 

11,06 

571,2 

0 

81,020 

6,5500 

7,6600 

4,77 

42 

133700 

10,530 

65,0 

0 

96,265 

3,3210 

0,39940 

0,0146 


* При нормальных условиях. 

** Задаются начальные приближения. 


Таблица 30. Характеристики потоков ТС 


Пара- 
метр (см. 
рис. 28 ) 

Тип огра- 
ничения 

Заданное 
значе- 
ние, "С 

Достиг* 
нутое 
значе- 
ние, в с 

Пара- 
метр (см. 
рис. 28 ) 

Тип огра- 
ничения 

Заданное 
значе- 
ние, °С 

Дости* 
гнутое 
«наче- 
ние, ®С 

т 4 

= 

150 

151,8 

Ті 7 


60,0 

60,2 

т , 

3= 

40 

48,4 

Г 4 з 

= 

445 

441,3 

Т» 

= 

302 

299,3 

г 38 

= 

465 

458,4 

Тц 

= 

206 

209,9 

г зв 

= 

200 

196,8 

Т«.о 

= 

468,3 

468,0 

Др(І) 

< 

1,11 * 

1,1 * 

т и 

= 

529,5 

533,4 

Ар (II) 

< 

0,2 * 

0,03 * 

Г,і 

— 

200,0 

199,6 

А Р (Ш) 

< 

0,03 * 

0,01 * 
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* в кПа - іо-*. 


С учетом всех технологических ограничений задача выбора 
оптимальных конструкционных параметров формулируется следую- 
щим образом. Найти значения Ы ІУ 1 ІУ і ІУ обеспечивающие минимум 
функции, характеризующей общую поверхность теплообмена для 
всех аппаратов в схеме 

12 

Я (N 1 , Іі, Іі)= 2 пйіІіЫі^тт (IV, 155) 

1=1 

при выполнении ограничений типа равенств: 

Т і = Т' і= 15, 19, 21, 22, 25, 26, 29, 35, 37, 41, 43 (IV, 156) 
и типа неравенств: 

Др (0 < Лр* (0 » = I, II, III (IV, 157) 

Перепад давления в і'-том теплообменнике вычисляется по общей 
формуле вида: 

Д р(і)=}{Ыі, Іі, іі)Х -^- (IV, 158) 

Здесь I — функция геометрических параметров, различно опре- 
деленная для трубного или межтрубного пространства теплообмен- 
ников; % — коэффициент гидравлического сопротивления, завися- 
щий от критерия Рейнольдса; ха — линейная скорость; р — плот- 
ность. Переменные Ы ІУ 1 ІУ і ь были ограничены снизу и сверху для 
каждого теплообменника. 

Для расчета целевой функции (IV, 155) и ограничений (IV, 156), 
(IV, 157) при заданной комбинации оптимизируемых переменных 
необходимо рассчитать стационарный режим всей схемы, показан- 
ной на рис. 28. Схема содержит один замкнутый контур, что делает 
необходимым проведение итераций по параметрам одного разры- 
ваемого потока. Для решения поставленной задачи оптимизации была 
использована система автоматизированного моделирования химико- 
технологических схем [105, 106], в которую включена программа 
оптимизации, использующая для учета ограничений модифицирован- 
ную функцию Лагранжа. 

•- Решение с требуемой точностью было получено за 15 итераций. 
Принтом число обращений к подпрограмме вычисления градиента 
составило^іб (градиент вычислялся по конечным разностям), а число 
обращений к подпрограмме расчета целевой функции (помимо вы- 
числения градиента) равнялось 49. На рис. 28 указаны значения тем- 
ператур и давления для всех рассчитанных потоков. Исходные дан- 
ные приведены в табл. 29. Все накладываемые ограничения (IV, 156), 
(IV, 157) и достигнутые значения по ограничениям приведены в 
табл. 30. 

В результате решения задачи оптимизации найдены значения 
N 1 , іі, іі для всех теплообменников. Найденный минимум критерия 
составляет 5738,1. 

Таким образом в результате решения задачи оптимизации по 36 
переменным при наличии 14 ограничений найдены оптимальные кон- 
струкционные параметры для 12 теплообменных аппаратов. 
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Оптимизация больших систем 


Усложнение задач моделирования приводит к существенному увели- 
чению их размерности. Так, в монографии [14, с. 239] утверждается, 
что в ближайшем будущем постановка задач исследования реальных 
химико-технологических схем может потребовать моделирования си- 
стем с несколькими тысячами переменных. 

Как будет показано, синтез ХТС также приводит к задачам опти- 
мизации большой размерности. Это определяет необходимость созда- 
ния таких методов оптимизации, эффективность которых мало зави- 
сит от размерности задачи. В настоящее время в работах по оптими- 
зации больших систем сформировались два направления. 

Первый подход состоит в том, что схему рассматривают 
как единое целое и пользуются поисковыми методами оптимизации. 
Проанализируем в связи с этим перспективы применения поисковых 
методов для оптимизации больших систем. Ранее вследствие трудно- 
стей получения аналитических выражений для производных часто 
применялись методы поиска нулевого порядка [11, с. 121], не тре- 
бующие вычисления производных. В настоящее время [107] обще- 
принятым является использование квазиньютоновских методов 
первого порядка, причем в случае трудности получения аналитиче- 
ских выражений для производных используются их разностные 
аппроксимации. Однако, способ вычисления производных с помощью 
разностей имеет большие недостатки. Действительно, вычисление 
производных с помощью разностей потребует (г + 1)-го расчета схемы 
(г — размерность вектора поисковых переменных), т. е. вычисли- 
тельные затраты на определение производных в этом случае, растут 
пропорционально размерности задачи, и при больших г могут стать 
чрезмерными. Следующий недостаток — неточность расчета произ- 
водных, которая может существенно исказить направления поиска, 
а следовательно, понизить эффективность метода. И, наконец, еще 
один недостаток — трудоемкость подбора приращений аргументов 
Ах(. 

Все указанные недостатки делают малоперспективным использо- 
вание разностных оценок производных при оптимизации больших 
систем. Поэтому для больших систем чрезвычайно важную роль 
приобретают алгоритмические методы вычисления производных. 
От наличия таких методов и основанных на них программ будет зави- 
сеть — станут ли квазиньютоновские методы первого порядка дей- 
ствительно инструментом решения задач оптимизации большой раз- 
мерности. Причем программы, основанные на алгоритмических мето- 
дах, должны обеспечивать не только точность и быстродействие вы- 
числений производных, но и требовать подготовительной работы 
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(аналитических выкладок, программирования), не намного большей, 
чем при использовании методов оптимизации нулевого порядка. 

Метод «сопряженного процесса», позволяющий эффективно вы- 
числять частные производные критерия [108 ], подробно изложен в на- 
писанной совместно с Ю. М. Волиным главе V монографии [11, с. 201 ]. 
При фиксированном числе блоков схемы вычислительные затраты 
этого метода мало зависят от размерности задачи оптимизации. С ис- 
пользованием этого метода была разработана [3, с. 267—288] си- 
стема программ моделирования ХТС; для схем произвольной струк- 
туры она позволяет вычислять значения производных критерия по 
поисковым переменным только на основе знания математических 
моделей отдельных блоков, матриц Якоби правых частей соотноше- 
ний (1,1) и информации о структуре ХТС. 

Вместе с тем даже при «точном» вычислении производных с по- 
мощью алгоритмических методов, эффективность квазиньютоновских 
методов оптимизации с возрастанием г, вообще говоря, должна сни- 
жаться. Так, если рассмотреть задачу минимизации выпуклой ква- 
дратичной функции для г * 2 и г = 100, то достижение минимума 
потребует в первом случае двух шагов, а во втором 100 шагов. Нет 
никаких оснований предполагать, что для неквадратичных функций 
положение изменится в лучшую сторону. Конечно, это не значит, что 
с увеличением г скорость сходимости всегда будет существенно 
уменьшаться. Решение ряда задач об оптимальном распределении 
параметров в реакторах идеального вытеснения и оптимизации кас- 
када реакторов идеального смешения показали [11, с. 50, с. 91 ], что 
в упомянутых задачах при возрастании г время, затрачиваемое на 
решение, увеличивалось незначительно. Тем не менее, в основном 
следует ожидать значительного снижения эффективности квазинью- 
тоновских методов с увеличением размерности задач. Поэтому боль* 
шее значение должны приобрести метод Ньютона и его модификации, 
которые, по*видимому, в наибольшей степени отвечают сформули* 
рованному выше требованию о малой зависимости эффективности ме* 
тодов оптимизации от размерности задачи. Действительно, для вы- 
пуклой квадратичной функции независимо от ее размерности метод 
Ньютона должен дать решение за один шаг. Отсюда можно полагать, 
что и для произвольных функций, близких к квадратичным, ско- 
рость сходимости метода Ньютона будет мало зависеть от размерности 
задачи. Правда, при этом необходимо преодолеть затруднения [11, 
с. 268]. Первое и самое большое из них — нахождение матрицы вто- 
рых производных. Если уже получение первых производных с по- 
мощью разностей вызывает серьезные затруднения, то путь вычисле- 
ния вторых производных разностными методами вряд ли можно рас- 
сматривать как реальный способ решения этой задачи. По-видимому, 
единственный путь состоит в развитии алгоритмических методов по- 
лучения матрицы вторых производных целевой функции. Такой под- 
ход, основанный на использовании аппарата «сопряженного процесса», 
был развит в работе [109]. Второе затруднение возникает при реше- 
нии систем линейных уравнений (или обращение матриц) большой 
размерности. Правда, как правило, матрицы этих систем являются 
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сильно разреженными, что делает целесообразным применение спе- 
циальных методов решения таких систем [36]. 

Оценивая перспективы применения метода Ньютона, следует 
отметить, что его широкое практическое использование начнется 
лишь после того, как на основе развитых алгоритмических методов 
будут созданы программы для ЭВМ, позволяющие для схем произ- 
вольной структуры вычислять значения вторых производных кри- 
терия по поисковым переменным только на основе знания матема- 
тических моделей отдельных блоков, и информации о структуре ХТС, 
т. е. программы, аналогичные вышеупомянутым программам вычис- 
ления первых производных. Поскольку трудно предположить, что 
такие программы будут созданы в ближайшие годы, основное приме- 
нение найдут квазиньютоновские методы первого порядка. Как мы 
уже отмечали, эффективность этих методов с увеличением размерно- 
сти задач должна уменьшаться. Однако, есть обстоятельство, кото- 
рое позволяет существенно повысить эффективность квазиньютонов- 
ских методов: при оптимизации больших систем либо сама структура 
ХТС приводит к тому, что гессиан целевой функции имеет сильно 
разреженную структуру (большое число нулевых элементов), либо же 
с помощью специального приема удается получить модифицирован- 
ный критерий, гессиан которого будет иметь сильно разреженную 
структуру. В связи с этим рассмотрим квазиньютоновские методы 
минимизации функций, имеющих сильно разреженные гессианы. 
Развитие этих методов началось в самое последнее время. Также как 
и в главе III мы здесь рассмотрим квазиньютоновские методы 1-го и 
2-го рода. 

Второй подход к оптимизации больших систем состоит 
в использовании декомпозиционных методов оптимизации. 

Декомпозиционные методы оптимизации 

Декомпозиционные методы оптимизации позволяют свести глобаль- 
ную задачу оптимизации ХТС большой размерности к последователь- 
ности локальных задач оптимизации отдельных блоков или совокуп- 
ностей отдельных блоков («суперблоков») существенно меньшей раз- 
мерности. При конструировании подобных методов главная проблема 
состоит в ликвидации или учете взаимного влияния блоков ХТС 
при формировании локальных задач оптимизации. В связи с этим был 
разработан принцип закрепления [ПО, с. 302 — 308], на основе кото- 
рого был создан декомпозиционный метод закрепления [1, с. 302; 
3, с. 182]. Независимо подобный метод был развит в работе [111]. 
Был предложен [112] и частный случай метода закрепления приме- 
нительно к решению систем уравнений, выражающих необходимые 
условия оптимальности ХТС (ІеазіЫе теіЬосІ). 

Другой способ построения декомпозиционных методов основан 
на использовании алгоритмов сведения задач на условный экстремум 
к задачам на безусловный экстремум. Перечисленные подходы были 
подробно рассмотрены в книгах [3, с. 182; 11, с. 242]. Здесь мы ко- 
ротко опишем только метод закреплении, 


Декомпозиционный метод закрепления 

Воспользуемся подходом, при котором задача оптимизации ХТС 
сводится к задаче 3 [см. выражения (I, 75), (I, 76)], причем в качестве 
независимых используем переменные х' , и, а в качестве зависимых — 
переменные г . Для решения применим двухуровневый метод. На 
первом (нижнем) уровне критерий Р будем оптимизировать по пере- 
менным «на втором (верхнем) уровне — • по переменным х'\ ограни- 
чения (I, 76) будем учитывать на нижнем уровне. Тогда задача 3 мо- 
жет быть представлена в виде: 

тіп Р (х' , и) = шіп тіп Р (х' , и) (V 1) 

*’ • х ' и^Р 3 

Обозначим через Р’ результат оптимизации на нижнем уровне. Ясно, 
что Р является функцией переменных х' 


Р' (х') = тіп р (х’, и) 

«€ о. 


(V, 2) 


Поскольку на первом уровне все промежуточные входные переменные 
х , а следовательно, и промежуточные выходные переменные г' ока- 
зываются фиксированными, то варьирование переменных ы<*>, отно- 
сящихся к к-иу блоку, будет влиять только на часть критерия Р <*> 
соответствующую к - му блоку; таким образом, на первом уровне взаи- 
мовлияния блоков ликвидируются, и задача оптимизации глобаль- 
ного критерия разбивается на N локальных задач оптимизации от- 
дельных блоков с локальными критериями р(**) ц локальными огра- 
ничениями, т. е. имеют место соотношения: 

N 


где 


Р' (х’) = тіп Р = У] тіп Р < А > (х', и) 

1 „(*) ^ р(к) 




х {к) ~ ! {к) (*<*>,«<*>)- 0 , а — /<*>(*(*>, «<*))= 0 } 


Этот метод можно применять, если в каждом блоке выполняется усло- 
вие Гі ре п . Характеризуя этот метод на базе сформулированных 
в гл. IV пяти критериев и сравнивая его с методом, при котором к 
к схеме подходят как к единому целому, можно сказать следующее. 

1. При расчете критерия отсутствует итерационная процедура. 

2. При решении локальных задач всегда необходимо использо- 
вать методы условной минимизации. 

3. На втором уровне необходимо решать задачу оптимизации, 
имеющую размерность т, (причем на каждом шаге этого уровня надо 
решать N локальных задач оптимизации, первого уровня, размер- 
ность каждой из которых равна г к . 

4. Учет ограничения (I, 10) не должен вносить осложнений, по- 

скольку метод «штрафа» используется независимо от этого, а их учет 
приведет только к увеличению штрафных членов штрафной функции 
к - го блока. ^ 

5. N локальных задач нижнего уровня могут решаться незави* 
симо, что удобно для параллельного счета, 


170 


Характеристика квазиньютоновских методов 
минимизации функций с разреженными 
гессианами 

Вначале покажем возможность появления критериев с сильно разре- 
женными гессианами. Иногда сама структура ХТС приводит к задаче, 
в которой критерий имеет сильно разреженный гессиан. Рассмотрим 
в виде примера задачу оптимизации последовательно-параллельной 
схемы (рис. 29), имеющей I параллельных ветвей, каждая из которых 
содержит п блоков. Пусть номер Ы, (Ы = т + Іп + 1) соответствует 
блоку смешения. Для простоты предположим, что в каждом блоке 
имеется только одно управление и, следовательно, число управлений 
равно т + пі. Пусть критерий оптимизации имеет вид: 

р = "е л к) ( ц(А) ) + "хГ р 2 к) = хі г ік) ^ к)) (ѵ - 3) 

к= 1 к—т-\-п 4=1 

ТТЬ тп ~ |— йп 

/<*> = 6,* 2 р\ 1) («<'>) + 2 ^ (/> (« (/) ) + р і т+кп) (* (т+ ‘ п) ) 

‘ /= 1 і=т+ (4— О я+1 

где б 1й — символ Кронекера. 

Ясно, что от управлений , ( і — 1, пі), относящихся к первым т 
блокам, зависят выходные переменные всех ветвей с хемы . Поэтому 
все Р> являются сложными функциями от ц (І) , ( і = 1, т). В то же 
время от управлений и ( - і) , (і = т + (к — 1) п + 1, .... т + кгі), 
относящихся к к - той ветви, зависит только совокупность выходных 
переменных /г-той ветви, т. е. только функция / (А> . Поэтому можно 
записать /< Л) в виде: 

І&) _ ^(4) ( И (1) І ( ц (т) ) и (т+ (4-1) л+1) ) 

Первые т строк (столбцов) гессиана функции Р (р ис. 30 ) соответ* 
ствуют дифференцированию по переменным и«>, (і = 1, т), следую- 
щие п строк (столбцов) — дифференцированию по переменным 
(і = т + 1, .... т + п) и т. д. Здесь и далее заштрихованная часть 
гессиана соответствует ненулевым элементам гессиана, элементы же, 
стоящие вне заштрихованных частей, тождественно равны нулю. 
К сожалению, в большинстве случаев при оптимизации ХТС гессиан 
критерия не получается разреженным. Так, если в схему, показан- 
ную на рис. 29, ввести рецикл, то гессиан будет плотно заполненным 






"5*. Вид ге с си ана критерия оптимизации (Ѵ,3) 
для схемы, приведенной на рис. 29. ' 


В связи с этим потребуются специаль- 
ные меры, для получения разрежен- 
ного гессиана. Воспользуемся под- 
ходом, при котором оптимизация ХТС 
сводится к задаче 1 [см. соотноше- 
ния (I, 64)— (I, 66)]. В этом случае 
число поисковых переменных равно г 
[см. выражение (1,52)]. Для учета 
ограничений на выходные переменные 
„ применим один из методов последова- 

тельной безусловной минимизации (для определенности — метод 
«штрафа»). Тогда модифицированный критерий будет иметь вид: 



Ф 1 = Д (* (А) > « ( ‘\ *<*») + р 2 ( г {*> - а<*>) 2 ) (Ѵ> 4) 

где р — штрафной коэффициент. 

При такой постановке задачи гессиан критерия Ф х в общем случае 
является плотно заполненным. Чтобы получить критерий с сильно 
разреженным гессианом поступим следующим образом. Выберем 
в качестве поисковых пере менны х наряду с ц<*>, (к = ТТЛО все вход- 
ные переменные (к = 1, Ы) блоков схемы, а соотношения связи 
(I, 6) будем трактовать как ограничения типа равенств. В этом случае 
число поисковых переменных /? равно 


N 


# = 2 ( г к + «Л) 


Обычно, К > ?, Сформируем модифицированный критерий, исполь- 
зуя один из методов сведения задач на условный экстремум к задачам 
на безусловный экстремум (для определенности — метод «штрафа») 


где 


Ф, 


2 ф?> 

Л- 1 


ф(А) ( х (к ) ( а (*) ( 


г (4) ) + р 


ік 

Е («і*> 

(=1 


«И:+ 


(V, 5) 


+ 2 Ы к) -і 

(— 5 Й + 1 \ / = 1 / . 

В таком виде критерий Ф 2 имеет сильно разреженный гессиан, если 
каждый блок ХТС связан с небольшим числом других блоков. В зна- 
чительном большинстве случаев выходной потод блоца не подается 
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на свой вход и среди его Выходных переменных неі- Выходных пере- 
менных схемы (д к = 0). При этом Ф<*> имеет вид: 


ф «) = р (к) _|_ р 2 


і=і 


г т 


N 


2 Ѵ (/) ( х</, *“ (/) ) 

/=і. </**> 


12 


(V, 6) 


В таком случае часть элементов гессиана функции Ф< А > легко может 
быть подсчитана 


д 2 фМ 
д (*<*>) 2 


д 2 Р {к) 


•Ь2Р 


<Э 2 Ф<*> 
дх }*) диФ 


= -«А/Р 


Э/<» 

ви}'> 


а 2 Ф^> о а/ф 

д*<*>д*<'> ах}') 


(V, 7) 


Таким образом, благодаря специальному выбору поисковых перемен- 
ных и существенному увеличению размерности задачи удалось при- 
вести критерий к виду, имеющему сильно разреженный гессиан. 
При этом существенно увеличилось число штрафных членов функции 
Ф 2 по сравнению с функцией Ф х , что должно ухудшить сходимость 
поисковых методов. Однако, вычислительный опыт показывает, что 
если в критерии имеются штрафные члены, то добавление новых ча- 
сто ненамного ухудшает сходимость применяемого метода. В любом 
случае, только опыт может дать ответ на вопрос: компенсирует ли 
получение сильной разреженности гессиана отрицательные послед- 
ствия увеличения размерности задачи и числа штрафных членов. 

В виде примера рассмотрим задачу оптимизации простой после- 
довательности блоков (см. рис. 22). Пусть ограничения на выходные 
переменные блоков имеются только в Ѵ-м блоке, а критерий оптими- 
зации имеет вид (I, 15), где § к = 0, ( к = 1, N — 1). Соотношения 
связи в данном случае имеют вид (IV, 60). В отличие от соотношения 
(V, 5) определим функцию Ф 2 в виде: 

Л1+1 

Ф 2 = 2 Ф 2 А) 

к— 2 

где 

ф(А) _ р(к-І) + р 2 [*<*> _ /<*—!> (*<*-!>, и <*-1>)]2 
і=1 

ф(ЛГ +1 ) = і? (») + 2 (г}") _ а}")) 2 

і=і 

Таким образом, функция Ф^, (к ~ 2, V) зависит только от пере- 
менных х < *~ 1) , х^ к \ а Ф^" 1 " 1 ' от переменных х (к1) , ы (Л,) . Гессиан 

функции Ф 2 размерности N (г + п) X N (г + п) приведен на рис. 31. 
В нем первые п строк (столбцов) соответствуют дифференцированию 
по переменным х П) , следующие г строк (столбцов) — дифференциро- 
ванию по переменным ц (1) , следующие п строк (столбцов) — диффе- 


(V, 8) 


к = 2, N 
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Рис. 31. Вид гессиана критерия оптими- 
зации (1,15) для схемы, приведенной на 
рис. 22. 


ренцированию по х { ^\ и т. д. 
На рис. 31 квадрат А к В к С к О к 
соответствует гессиану 0 ( *> 
функции Ф***. Поскольку для 
блоков с номерами і = 1 , 2 ,..., 
N — 1 критерий имеет вид (Ѵ,6), 
часть элементов гессиана функ- 
ции Ф|*> может быть подсчи- 
тана с помощью формул (V, 7) 
(на рисунке эта часть отмечена 
двойной штриховкой). Эле- 
менты квадрата А к Е к Р к С к со- 
ответствуют переменным х<*>, 
входящим как в функцию Ф^\ так и в функцию Ф^ +2> . 

Резюмируя приведенное рассмотрение, отметим, что в гессиане 
могут быть элементы двух видов. Элементы первого вида — постоян- 
ные числа (в частном случае равные нулю), второго вида — легко 
вычисляемые [например, с помощью формул (V, 7)] выражения. 
Относительно построения квазиньютоновских методов минимизации 
функции с разреженными гессианами можно сказать то же, что было 
сказано о построении методов решения систем нелинейных уравнений 
с разреженными матрицами Якоби. Ясно, что мы должны аппрокси- 
мировать сам гессиан, а не обратную ему матрицу, поскольку гессиан 
может иметь большое число нулей, а его обратная матрица — быть 
плотно заполненной. При построении матриц В і} аппроксимирующих 
гессиан О, желательно сохранить структуру самого гессиана, т. е. 
обеспечить равенство постоянных (в частности нулевых) и легко вы- 
числяемых элементов матрицы О соответствующим элементам ма- 
трицы В. 

К вазиньютоновские методы 1-го рода 

для минимизации функций с разреженным 

гессианом 

Пусть требуется минимизировать функцию / (х), где х— п-вектор 
с разреженным гессианом. Построение алгоритма минимизации таких 
функций будет основываться на подходах, развитых при выводе ква- 
зиньютоновских методов: метода 1-го рода для минимизации произ- 
вольных функций и метода решения систем нелинейных уравнений 
с разреженной матрицей Якоби. Так же, как и в последнем методе 
введем множества М 1г М 2 , М, М следующим образом: М х — множе- 
ства пар целых чисел (і, /) таких, что соответствующие элементы О 
гессиана являются постоянными, не зависящими от точки (номера 
итерации), т. е. выполняются равенства 

Оц = рц (і, і)€Мі 
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(V, 9) 


где ри — некоторые постоянные (в частном случае равные нулю); 
Л4 2 — множество пар ( і , /) таких, что соответствующие элементы Оц 
легко вычисляются; 


М=--МіУМ 2 м = {(1, /):((', !)ФМ} 


Задача состоит в построении такой матрицы В к+1 в (к + 1)-й точке, 
которая являлась бы некоторым приближением к гессиану 6 к + 1 , 
а ее элементы Ь, 7 +1) , (к = 1, п) удовлетворяли бы соотношениям 


6 (Ні) 


РИ 

сМ+Ц 

ч 


(«'. /)€Л*1 
(*> І)^Щ 


(V, 10) 


Матрицу В Л+1 будем искать в виде (II, 38); она должна удовлетворять 
квазиньютоновскому условию 1-го рода (11,25) и условию симме- 
тричности (111,47). Отсюда следует, что матрица Е должна удовле- 
творять условию симметричности, а ее элементы — соотношениям 


{ О V, і)€М 1 

11 ~ 1 с і/ +1) - = АО}*» (<, /) 6 Щ 


(V. 11) 
(V, 12) 


Для определения матрицы В к+1 применим принцип наименьшего 
изменения матрицы В к . Тогда задача определения матрицы Е будет 
выглядеть следующим образом: 


1 

тіп -о- 

І№ 

(V, 13) 

е И 



'і} в і — г і, к 

і = 1 , п 

(V, 14) 

і = е Н 

і, іт і, п 

(V, 15) 

г = 0 

(»'. І)€М і 

(V, 16) 

= Л0<*> 

Ч 

(*’> /)€44 2 

(V, 17) 


Сформулированная задача отличается от задач (111,52) — (111,54) и 
(II, 164) — (II, 167) наличием условий (V, 16), (V, 17) в первом случае 
и условия симметричности (V, 15) — во втором. Рассмотрим вначале 
случай, когда множество М 2 пусто [113]. Введем вектор-строку 5 (г) 
с элементами 5 (і) } - [см. выражение (II, 168)]. Подставим в уравнение 
(V, 14) значения ец, удовлетворяющие условию (V, 16). Полученные 
соотношения с помощью вектора 5 ( і ) могут быть записаны по анало- 
гии с уравнениями (II, 170) в виде 

П 

е а в ( { )і = П,к і = і, п (V, 18) 

/= і 

Как будет видно из дальнейшего, запись условий (V, 14) в виде 
(V, 18) обеспечит автоматическое выполнение условий (V, 16), поэтому 
соотношения (V, 18) эквивалентны соотношениям (V, 14), (V, 16). 
Чтобы удовлетворить условию симметричности (V, 15) будем так же, 
как и при решении задачи (III, 52) — (III, 54) искать матрицу Е в виде 
(III, 56). Заменяя в задаче (V, 13) — (V, 17) соотношения (V, 14), (V, 16) 
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соотношением (V, 18), представляя матрицу ё в виде (III, 56) и учи- 
тывая, что М 2 0, сведем эту задачу к следующей 

тіп ^ 2 ( с и+ с л) 2 
с и (=і і= і 

2 ( с и 4~ с н ) 5 {*■)] = 2 гі і й (V, 19) 

/=--і 

Функция Лагранжа для этой задачи имеет вид 

Ь Ш. У ^ ( Сі] -р С]і) 2 -р 2 Хі ^ (Сіі -р С;-;) 5 ((')/ 

1=1 /= 1 1=1 /= 1 

Приравнивая производные от ^ по элементам сц, нулю, по аналогии 
с формулой (111,57) получим 

ец — — [Тцх (і)і -р (у),] (V, 20) 

Полученное выражение для е и удовлетворяет условию (V, 16). 
Действительно, из условий симметричности матрицы О следует, 
что если 5(Д/ = 0, то и 5 (/),■ = 0. Отсюда, если (і, /)рЛ4 1(! то 
5 (І) І - — 5 (/) ; и, следовательно, 0. Подставив это выражение 

для в условия (V, 18), получим систему линейных уравнений для 
определения неизвестных величин 

<}Х = г к (V, 21) 

где элементы матрицы СІ имеют вид 

<2и = « (0і 5 Ц)і + ^ [« (Ой] 2 6 ; і 

*= і 

а 8^- — символ Кронекера. Если при решении задачи (111,52) — 
(III, 54) удалось в явном виде получить выражение для Е [см. выра- 
жение (III, 109)], то в данном случае для определения этой матрицы 
придется решать систему линейных уравнений (V, 21). Правда, эта 
система обладает двумя свойствами, облегчающими ее решение. 
Прежде всего, ее матрица <2 имеет практически ту же степень разре- 
женности, что и сам гессиан О. Действительно, если Оц = 0 (і ф /), 
то 5 (і)^ — 0 и, следовательно, С1ц = 0. Кроме того, если все векторы 
5 ( і ) ненулевые, то матрица (2 положительно определенна [113]. 

Рассмотрим теперь случай, когда множество М 2 не пусто. Выше 
было показано, что соотношения (11,165) — (11,167) эквивалентны 
соотношению (II, 180). Поскольку соотношения (V, 14), (V, 16), (V, 17) 
совпадают с соотношениями (11,165) — (11,167) [за исключением того, 
что в соотношении (11,167) величины А/)/* надо заменить на АО,у ) ], 
соотношения (II, 180) будут верны и в данном случае. Единственное 
отличие будет состоять в том, что элементы е (і, /) ^ Л4 2 в вели- 
чине г і будут определяться формулами (Ѵ,12). Заменяя в задаче 
(V, 13) — (V, 17) соотношения (V, 14), (V, 16), (V, 17) соотношением 
(II, 180), представляя элементы ё і3 в виде ё и т 0,5 (с і} + ё н ), что 
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гарантирует выполнение условия (V, 15), сведем эту задачу к следую- 
щей 

шіп ^ 2 {сц + сл)* 
с и і = і /= і 

2 (^/і + с и) 5 (*'); = 2г і > к (V, 22) 

/=1 

Если в задаче (Ѵ,22) вместо с і} -, 8 (і) 7 -, г і>й подставить величины 
с;;, $(і)і, Гі, й, то придем к задаче (V, 19). Поэтому можно воспользо- 
ваться решением задачи (V, 19) . Формулы для определения ё и бу- 
дут иметь вид (Ѵ,20), (Ѵ,21), надо только везде заменить еі<, 8 г (/);, 
Гі,и на ё г1 , 8 (і)і, г і>к соответственно. 

При рассмотрении квазиньютоновских методов 1-го рода было 
показано, что лучшие результаты дает подход, при котором берется 
норма Фробениуса от некоторой взвешенной суммы (III, 66). Легко 
видеть, что в данном случае определение матрицы Е сведется к реше- 
нию следующей задачи 

тіп [| \ѴЕ\Ѵ || (Еи = г к , Е г = 5) ец = О (і, }) $ М г (Ѵ-, 23) 
е И 

Проведя такие же рассуждения, как при получении соотношений 
(111,69), (111,70), легко показать, что задача (V, 23) может быть све- 
дена к следующей 

тіп || V Н/г Ѵз = Гк Ѵ г — Ѵ (V, 24) 

ѵ іі 

||^- 1 Ѵ'^- 1 ||і> = 0 (і, /)€^! (V, 25) 

где 8, г к — величины, определяемые формулами (111,71), а через 
1 '№~' х У'№~ 1 1ц обозначен элемент матрицы стоящей на пере- 

сечении і-той строки и /-го столбца. К сожалению, в данном случае 
условие (V, 25) не удается так же просто учесть, как условие (V, 16) 
в предыдущем случае, поэтому каждое соотношение должно быть уч- 
тено в функции Лагранжа с помощью соответствующего мнсщителя 
Лагранжа. В этом случае задача определения множителей Лагранжа 
становится трудоемкой, поскольку требует решения системы линей- 
ных уравнений большой размерности. Причем чем сильнее будет 
разреженность гессиана, тем больше будет условий типа (V, 25) и тем 
сложнее будет определение множителей Лагранжа. В связи с этим 
был предложен следующий подход [114]. Пусть, как и прежде, М г 
характеризует множество нулевых элементов, а УИ 2 — пустое мно- 
жество. Вначале найдем обычным путем матрицу В, которая обеспе- 
чивает хорошую работу квазиньютоновского метода; пусть, напри- 
мер, это будет матрица (III, 80). Для простоты обозначим ее через В*. 
Естественно, что структура матрицы О в ней не будет отражена, и, 
вообще говоря, она не будет содержать нулевых элементов. Поста- 
вим теперь задачу найти матрицу В*, определяемую формулой 

в* = в* + Е (V, 26) 
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Элементы матрицы В* известны, и требуется найти элементы ма- 
трицы Е. Матрица В * должна отвечать следующим условиям. 

1. Удовлетворять квазиньютоновскому уравнению (11,25) 

В*3] = у} 

Отсюда получим условия для матрицы Е, умножив формулу (Ѵ,26) 
на 5;, получим: 

В*3] = В*31 + Е8} (V, 27) 

но поскольку по построению матрица В * удовлетворяет условию 
(II, 25), равенство (V, 27) принимает вид 

Ез і = О (V, 28) 

2. Быть симметричной, поскольку таковой является матрица В *, 
симметричной должна быть и матрица Е. 

Нулевые элементы матриц О и В* должны соответствовать друг 
другу, т. е. должны выполняться соотношения 

е іі = ~ Ь Ц {і ' І^ М 1 (V, 29) 

Норма Фробениуса матрицы Е должна быть минимальной. Таким 
образом, матрица Е должна быть определена решением следующей 
задачи: 

тіп ^ XI е ?/ ( ѵ > 30 ) 

е И (=1 /=і 

23 V/ = 0 і = е ч = е и і = ТТТі 

і= і 

«,/ = —< Ь Ь Л € 

Формально задача (Ѵ,30) может быть сведена к ранее рассмотрен- 
ной задаче (V, 1 3) — (V, 1 7) , если положить о, множество счи- 
тать пустым, множество М 2 обозначить через М ъ а величины А 0*/ ) 
заменить на — Ь*,-. Следовательно, для решения задачи (V, 30) мы мо- 
жем воспользоваться методом решения, изложенным выше. 

Блочные квазиньютоновские методы 2-го рода * 

Основная идея этого подхода состоит в следующем. При построении 
обычных квазиньютоновских методов (см. гл. III) ищут аппроксима- 
цию гессиана для всей целевой функции. В данном же случае, когда 
известна структура целевой функции, вначале аппроксимируют гес- 
сианы отдельных частей целевой функции, после чего конструируют 
аппроксимацию к гессиану самой целевой функции [115]. 

Рассмотрение, приведенное выше [см. выражения (V, 3), (V, 5) ] 
показывает, что критерий / в задачах оптимизации ХТС может быть 
представлен в виде: 

/(*)= 23 / №) (* (А) ) ( ѵ - 31 > 

к=\ 

где х — п-вектор поисковых переменных; х (к) — п А -вектор поисковых 
переменных, от которых фактически зависит функция / (А) . Обозначим 

* Раздел написан совместно с Е. М. Михайловой. 
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через Хі, х\ к) значения векторов х, х (к) на і-той итерации, через х и и 
х ( ц ) — 1-ю компоненту вектора хі, х\ к \ соответственно. В продолже- 
ние итерационной процедуры минимизации / необходимо строить не- 
которую аппроксимацию гессиана функции /. При этом справедлива 
формула 

N 

а а 1к) (V, 32) 

к^І 

где С, гессианы функций /, соответственно. Построение 

аппроксимации В гессиана 0 будет протекать в следующем порядке. 
Вначале на і-той итерации будут определяться аппроксимации В\ к \ 
(к — 1, УѴ) гессианов 0\ к) (к = 1, Л/), потом по аналогии с формулой 
(V, 32) будет строиться матрица В* 

N 

В і = 2 В«*> (V, 33) 

к = 1 

Рассмотрим два способа получения матрицы В\ к) . При первом 
способе используется специальный вид функций /<*>; из выражения 
(V, 5) следует, что функции /<*> могут быть представлены в виде 


(V, 34) 
і=і 


где функции <р № соответствуют штрафным членам, а Ч^ является дру- 
гим обозначением функции Р<- к К Вид функций ц> !к соответствует 
выражению (V, 5). Будем исходить из предположения, что гессиан 
функции 4 я ( х <*>) легко может быть выписан. Эта ситуация создается 
в случае, когда часть критерия Р, относящаяся к к - му блоку, зави- 
сит только от управляющих переменных и ік) . Однако зависимость 
р(к) от и (к) обычно является достаточно простой, что позволяет выпи- 
сать гессиан этой функции. В данном случае требуется аппроксими- 
ровать только сумму, стоящую в правой части равенства (Ѵ,34). 
Используя правило дифференцирования сложных функций, найдем 


д 2 / Щ у ду 1к д<р 1к у а а Ф Ік , 

дхідх] ^ дхі ' дхі ^ ѴІк дхідхі ' дхідхі 

і=і і=і 


(V, 35) 


Аппроксимируем гессиан функции отбросив в правой части этого 
равенства вторую сумму, т. е. определим аппроксимацию гес- 
сиана С к следующим образом: 


/ = 1 


дЦік , 

дх) дхі дХ] 


(V, 36) 


Эта аппроксимация будет тем более точной, чем ближе функции <р ік 
к линейным, а итерационная точка к точке минимума, поскольку в этом 
случае функция (р //г близка к нулю. При соблюдении этих условий 
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вторая сумма в выражении (V, 35) будет величиной второго порядка 
малости по сравнению с первой суммой. 

Рассмотрим теперь другой способ построения матриц В<*>. Выпи- 
шем некоторые очевидные формулы 

N 

= Ц в (к) (V, 37) 

А= 1 

г Д е §і> ёі ) соответственно градиенты функций /, / (А) в г'-ой точке 

N 

Уі = Ц у\ к) (V, 38 ) 

*= і 

где 

Уі^Віл у (к) 

Вначале рассмотрим случай, когда все /( /г) , а следовательно и 
/ — квадратичные функции. При этом гессианы О, С<*> будут матри- 
цами коэффициентов соответствующих квадратичных функций. Если 
аппроксимацию В гессиана О строить сразу для функции /, то в і-той 
точке Ві можно найти из матричного уравнения (II, 29). Вид матриц 
5 г , У і задается формулами (11,27). 

Перейдем теперь к нахождению аппроксимации каждого гессиана 
всех составляющих /(*> функции /. Предположим, что доступны вы- 
числению как сама функция / (4 >, так и ее градиент Обозначим 
через В\ к) некоторую аппроксимацию гессиана 0\ к) функции / (А) 

в точце Хі. По аналогии с соотношением (II, 29) найдем В\ к) из ма- 
тричного уравнения 

' (Ѵ)39) 

(где У\ к) =(уо к \ ..., у\ к \) с помощью любой из формул семейства Ада- 
чи (II, 90), (II, 91) (подробнее об этом см. ниже). Пусть определены 

все Ві . тогда матрицу Ві будем формировать с помощью формулы 
(V, 33). Покажем, что матрица построенная с помощью формулы 
(Ѵ,33), в которой В\ к) удовлетворяют соотношениям (Ѵ,39), будет 
удовлетворять соотношению (11,29). ■ Действительно, из формулы 
(V, 38) вытекает равенство: 

Ус=%У\ к) (V, 40 ) 

А=1 

Подставим полученное выражение для и В; из формулы (V, 33) 
в соотношение (11,29) 

2 (в<*>5,-У<*>) = о 

А= 1 

Поскольку матрицы В\ к) удовлетворяют уравнениям (V, 39), мы 
пришли к тождеству и наше утверждение доказано. Если размерности 
векторов и х совпадают, такой подход мало что может дать. Иначе 
обстоит дело, когда размерности векторов существенно меньше 
размерности вектора х. Пусть выполняется условие п , Обозна- 
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чим через М к множество номеров компонентов вектора х <*>, от кото- 
рых фактически зависит 

44 к — |*і * п к\ (V, 41) 

а через М (/14 = \і : 1, 2, п}) — множество индексов перемен- 

ных, от которых зависит функция /. Рассмотрим пример. Пусть 

/ = / (1) (х ъ х 2 ) + /< 2 > (х ъ х а ) + /< 3) (х ъ Ха, * 4 ) (V, 42) 

и *<» = {х ъ х 2 ): хЮ =(х ь ха); х< 3 > = (*,, х 4 ); М 1= = {1, 2}; Л4 2 == 

— {1, 3}; Л4 3 = {1, 3, 4}. В соответствии с определением множества 
М к справедливы соотношения 


*и у и 

о<*> = о 


/ ^ Л1 А или / 9* Л4 Й 


(V, 43) 
(V, 44) 


Поскольку фактически зависит от небольшого числа переменных, 
векторы §<*', */<*> будут иметь большое число нулевых компонент, а 
гессианы 0< А) — достаточно много нулевых строк и столбцов, 
хранить которые не имеет смысла. Обозначим через градиент 
функции / ( *>, компонентами которого являются только производные 
! {к) по переменным, фактически входящим в вектор х<*>. Введем обо- 
значения 

й (к) ^> = *Й_>, - *<•*) (V, 45) 


Лк) _ Лк) _ (к) 
8. — Х і+І Х і 


У ( ; к) = № к) > У}^) $?' = {€’> •••. та (Ѵ.46) 

Формально векторы §\ к) , у \ к) , получают из векторов §\ к \ уі к) , 
5;, вычеркнув нулевые компоненты. Происходит «сжатие» этих 
векторов. Соответствие между компонентами векторов §1 к \ Уі к \ з\ к) 

и ё\ к \ Уі к) > 5» можно представить с помощью следующей «таблицы 
соответствия»: 

::: ::: V (ѵ ' п > 

Верхняя строчка «таблицы» А к соответствует номерам компонент 
векторов д (кі , у\ к) , з \ к) , а нижняя — номерам компонент векторов 
§\ к ‘ у\ к \ $і- «Таблица» А к задает соответствие между элементами 
верхней и нижней строки: так, элементу /-той верхней строки соответ- 
ствует стоящий под ним элемент нижней строки //. Это соответствие 
означает, что /-тая компонента вектора у\ к) , §) А) является ь- той 
компонентой вектора \ у\ \ $і соответственно: 






о (к) _ , 

% ~ в Пч 


Лк) _ <*> 
У ІЧ ~ У ііЧ 


I = 1. Я* 


(V, 48) 


Ясно, что множество М к может быть записано в виде М к = {/, : / = 
= 1, п к \. Тогда «таблицы» А к для соотношения (V, 42) будут иметь 
вид 

*-(! :) ■-"(! з) л ‘={\ з у < ѵ ’ 49 > 
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Соответствие элементов нижней строки А к элементам ее верхней 
строки и обратное соответствие будем иногда записывать в виде 

Іі = А к {1) / = ЛД(/ г ) (V. 50) 

В качестве примера приведем ряд соотношений (V. 50) для «таблиц» 
(V, 49). 

3 = Л 2 (2) 2 = (3) 4 г. л : . (3) 3=4 Л- 1 (4) 

Образуем теперь гессиан функции / (/г) при условии, что вторые про- 
изводные в нем берут только по фактически входящим в /<*) перемен- 
ным. Этот гессиан обозначим через С (к) 


\дхідхі)(і,і 


і) € м к 


(V, 51 ) 


Формально матрицу получают из 0 (А) , вычеркивая все нулевые 
строки и столбцы. Числа нулевых строк и столбцов равны. Для соот- 
ношения (V, 42) матрицы С (6) будут иметь вид 


0 <» = 



5,,> -(х х) гя "(х х) 


Здесь значок х обозначает ненулевой элемент. Построим аппрокси- 
мацию В\ к) гессиана 0\ к) . Вначале рассмотрим случай, когда п х = 
= п 2 = •••=«. Матрицу В (к) будем строить таким образом, чтобы 


она сохранила структуру матрицы О) 


(к) 


т. е. 


и столбцы матрицы 0\ к) стали нулевыми строками и столбцами ма- 
трицы В\ к) . Итак, в соответствии с (V, 44) все строки матрицы Ві к) 
с номерами I Ф М к и столбцы с номерами і Ф М к будут нулевыми, 
т. е. 

&<*>=() 1 &м к іфМ к (V, 52 ) 


все нулевые строки 


По аналогии с матрицей 0 {к) введем матрицу В\ к) , которую получают 
из матрицы В (к) , вычеркивая все нулевые строчки и столбцы, т. е. 
строки с номерами і Ф М к и столбцы с номерами / Ф М к . Элементы, 
стоящие на пересечении /-той строки и < 7 -го столбца матрицы В іг 
В {к) , В\ к) щ обозначим через Ьц, Ьц\ Ъ ( щ , соответственно. Для про- 
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Стоты записи опущен индекс і — номер шага. Естественно, что 
строчки (столбцы) матрицы В (к) в матрице В\ к) получат другую 
нумерацию. Соответствие между номерами строк (столбцов) матриц 
В\ к) и В (к) может быть задано с помощью «таблицы» А к . В верхней 
ее строке располагаются номера строк (столбцов) матрицы ~Ё\ к) , 
а в нижней — номера соответствующих _строк (столбцов) матрицы 
В (к) . Так, /-тая строка (столбец) матрицы В\ к) становится / г той стро- 
кой (столбцов) матрицы В\ к \ При этом, очевидно, выполняются соот- 
ношения 




14 $ 


1 = Е п к 


8 ==!’«* іі^ М к ІЛЩ (Ѵ.53) 


Матрицу В {к) построим следующим образом. Вначале матрицу опре- 
делим В\ \ Зная матрицу В\ к \ с помощью соотношений (V, 52), 

(V, 53) построим матрицу В (к) . Матрицу В\ к) определим из матрич- 
ного уравнения 

(V, 54) 

Здесь матрицы 8\ к) , У (к) определяются соотношениями (Ѵ,46). Пока- 
жем теперь, что если выполняются равенства (Ѵ,54), (V, 52), то со- 
блюдаются равенства (V, 39). Используя правило перемножения ма- 
триц, получим, что равенство (V, 39) эквивалентно іп 2 соотношениям 

И Ь/гЧ? = У ( $ 1 = ТГп я= 0, і - 1 (V, 55) 

Г= 1 

а равенство (V, 54) эквивалентно іп\ соотношениям 

/ = Т ~к < 7 = 0 , і— 1 (V, 56) 

Г=[ 

Итак, пусть выполняются соотношения (V, 56), (V, 52), тогда будут 
выполняться соотношения (V, 55). Действительно, при I & М к в со- 
ответствии с соотношениями (V, 43), (V, 52) левые и правые части 
выражения (V, 55) обращаются в нуль и, следовательно, это соотно- 
шение выполняется. Пусть теперь / = Д ^ ЛД. В соответствии 
с условием (V, 52) соотношение (V, 55) можно переписать в виде 

= С (V, 57) 

Подставляя в это выражение величину Ь 1(Іт из (V, 53) и величины 

5 і г ч< Уі(Я из условий (Ѵ,48), получим соотношение (V, 56), что и до- 
казывает правильность соотношения (Ѵ ; 55), а, следовательно, и 
(Ѵ,39). Ранее было доказано, что из соотношения (V, 39) следует 
равенство (II, 29). Итак, получаем следующий способ построения ма- 
трицы Ві. Вначале следует найти матрицы В\ к ^ из систем уравнений 
(V, 54). После этого надо было бы сформировать матрицы В\ к) (к = 
= 1, М) и с помощью соотношения (V, 33) найти матрицу В ь . Факти- 
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йеекй, нет необходимости формировать матрицы В\ \ Зная соотно- 
шения (V, 52), (V, 53), можно сразу формировать элементы матрицы В г 
из элементов матриц В\ к) . Действительно, используя соотношения 
(V, 33), (V, 52), (V, 53) и (V, 50), получим 

^= 2 ^ < ѵ - 58 > 

к = 1 

го і ф Ми І & м к 

6 = 1 р т А? (0 я = (/) «\ / € Л* й 

Пусть теперь для і = 1, .... « оказалось возможным определить 
все матрицы В\ к) , {к = ГГЛО из системы (V, 54) Тогда при і = п 
в соответствии с выражением (III, 109) получим В к =0 , т. е. точное 

значение гессиана квадратичной функции а в соответствии с равен- 
ством (V, 33)и точное значение гессиана О всей квадратичной функции 
/. Отсюда при і=й+ 1 найдем точку минимума (при условии, что 
сіе! С п Ф 0). Для определения матрицы В (к ) из уравнения (V, 54) 
может быть использована любая формула из семейства (II, 90), (II, 91), 
при выводе которых не использовалось свойство сопряженности на- 
правлений. Нельзя использовать такие широкоизвестные формулы, 
как БРР, ВРС5 и др. Это связано со следующим обстоятельством. 
Ранее было доказано, что если матрица Н ( удовлетворяет уравнению 
(И, 32), то направления р,-, (] = 0, 1, .... п — 1), даваемые формулой 
(1,41), будут сопряженными. Аналогичное утверждение справедливо, 
когда 'строят матрицу В*. Следовательно, если только решение систем 
уравнений (V, 54) может быть проведено для всех і 1, ..., Л, то 
направления р и ( і = 0, 1, .... п — 1) в полном пространстве пере- 
менных х будут О-сопряженными. Однако, утверждать, что векторы 
5 (») будут 0 (А) -сопряженными, нельзя, поскольку в подпространст- 
ве переменных х^ направление поиска р\ * будет определяться не 
формулой В (к) ~р (к) = — ё?\ а проекцией вектора р с на подпростран- 
ство переменных х (к) . Отсутствие С (&) -сопряженности векторов з ( , 
п = о, 1, ..., іг — 1) ведет к невозможности гарантировать их ли- 
нейную независимость. При их линейной зависимости иліг близости 
к таковой возникнут трудности с определением матрицы В ( из си- 
стемы (V, 54). 

Рассмотрим теперь случай, когда величины п к могут быть раз- 
личными. Рассуждая так же, как в случае применения^блочного ква- 
зиньютоновского метода расчета ХТС при различной размерности 
потоков, легко показать, что минимум квадратичной функции будет 
найден при і = тах п к -\- 1. 

Сравним теперь рассмотренный метод с обычным квазиньютонов- 
Ским методом. При применении последнего для хранения матрицы 
Ні или Ві потребуется п 2 ячеек памяти, и минимум будет достигнут 
за п шагов. При использовании изложенного подхода и применении, 
например, формул (II, 103), (II, 104) для нахождения матриц В ( по- 
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требуется 2 (п? -) \-п%) ячеек памяти и минимум будет найден 

за число шагов, равное тахп к -\-\. Пусть, например, п— 100, 
N = 10, п к = Ю, (к = 1, 10). Тогда обычный подход потребует ІО 4 
ячеек памяти и минимум будет найден за 100 шагов, при примене- 
нии изложенного подхода потребуется 2’ ІО 3 ячеек памяти и минимум 
будет найден за 11 шагов. 

В качестве примера рассмотрим последовательно-параллельную 
схему (см. рис. 29). В этом случае функция / имеет вид(Ѵ, 3). Обыч- 
ный квазиньютоновский метод потребует ( т + я/) 2 ячеек памяти 
ЭВМ для хранения элементов матрицы В;. Метод же, изложенный 
выше, потребует 21 (п + т) 2 ячеек для хранения матрицы В;. Если 
критерий (V, 3) будет квадратичной функцией переменных г<*\ 
а модели блоков — линейными, то обычный квазиньютоновский ме- 
тод потребует т + пі итераций, а рассмотренный - только 
т + п + 1 итераций. Заметим, что эффект уменьшения числа итера- 
ций связан со слабой заполненностью гессианов функции / ( а не 
гессиана самой функции /. Гессиан функции / может быть сильно 
заполненным, тем не менее эффект уменьшения числа итерации 
будет наблюдаться, если гессианы функций будут сильно разре- 
женными. В этом может быть преимущество таких методов по сравне- 
нию с квазиньютоновскими методами 1-го рода, для которых сущест- 
венна сильная разреженность самого гессиана функции /. Преиму- 
щество перед квазиньютоновскими методами Г го рода состоит 
также в том, что блочные квазиньютоновские методы обладают свой- 
ством квадратичного окончания, т. е. они позволяют найти минимум 
квадратичной функции за число шагов, равное максимальной раз- 
мерности векторов х^К Однако, при применении данного подхода 
могут возникнуть и трудности, связанные с определением матрицы 
В\ к) ' из уравнения (Ѵ,54) в случае близости к линейной зависимости 
п к векторов Зо к \ ..., 5 ^_|. Если такая ситуация возникает, надо 

предпринимать специальные меры. 

Проиллюстрируем рассмотренный подход для схемы, представ- 
ленной на рис. 22. Функция (V, 31)будет иметь вид (V, 8). Размерность 
гессианов 0 (А) равна 2 п + г. «Таблицы соответствия» А к будут иметь 


вид: 

Ак = Сь + 1 


п ... п г ... 2 п + г \ 

І к + п ... Ін + п + г ■■■ бі + 2«+г/ 


Ік=(п+г) (Ь — 0 


Поскольку часть гессиана О ^ легко ^вычисляется, аппроксими- 
ровать придется только часть_ гессиана 0 (А) , имеющую размерность 
п + г (размерность матрицы В к будет не 2п + г, а п + г). Оценим, 
что может дать этот подход. Пусть модели всех блоков линеины, и 
ф<*) квадратичные функции. Тогда при использовании обычного 
квазиньютоновского метода потребуется (Яг + п) 2 ячеек памяти для 
хранения матрицы Я* или В,, и минимум будет найден за (Яг п ) 
шагов. При применении рассмотренного __ метода потребуется 
2Ы (2 п + г) 2 ячеек памяти и минимум будет найден за ( п т г) шагов. 
Пусть, например, Я - 30, п = 3, г » 2; тогда при использовании 
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обычного квазиньютоновского метода придется хранить около 4000 
элементов матрицы Д г или Н ( и минимум будет найден за 63 шага, 
а при применении рассмотренного метода минимум будет найден за 
о шагов, и необходимо будет хранить около 2000 элементов. 

Примечание. Подход, в соответствии с которым аппроксими- 
руются отдельные части гессиана, а затем конструируется полный 
гессиан, может быть применен и к более сложным функциям, чем 
выражения (V, 31). Пусть, например, минимизируемая функция 
имеет вид: 

/-П/і, .... / Р ) 

где ( х і’ х п) функции п переменных, а Р — функция р 

переменных. Используя правило дифференцирования сложных 
функции, легко получить выражения для вторых производных 
функции /: г 


р / 

Л -У 

дР 

дЧк 

Р 

. V 

д*Р 

дік 

діі \ 

дхі дху ^ 1 

к=1 ' 

^ дік 

дхі дх] 

^ 2.1 

/=і 

дік діі 

дхі 

дх} 1 


Ф ормул а (Ѵ,59) связывает элементы гессианов функций [ и / г ( I = 
^ ’ г>\\ П У СТЬ спос °бом, описанным выше, построены аппроксима- 
ции ст гессианов функции / (А) ; тогда по аналогии с выражением 
(V, 59) элементы матрицы В будем подсчитывать с помощью формулы 


Ь И 


к= 1 N /^1 


д 2 Р 


дік діі 


дік 

дхі 


діі 

дхі 


Рассмотрим частный случай, когда — квадратичные функции. 
если МЬІ используем первый способ для получения матриц 
В , то, начиная с п-то шага и далее, будем иметь точные значения 
уе^сианов функции / ь а, следовательно, в соответствии с формулой 
(V, 59), точное значение гессиана функции /; т. е. через п шагов 
будет работать метод Ньютона. 

В качестве примера была проведена оптимизация следующих 
двух функций (/ и ср), имеющих структуру (V, 3): 

іо / э , 

* = 2, (2 , (к + 1 * ! |2 ("/ + 4 +/) + к | 
ф = ^ [* 2 “і4+і + (* + в 2 '44+2 + а2 "з4+з + 


+ (^ + і) + & 2 44+з + (* + в 2 "з4+і I 

Для оптимизации был испоДьзован метод ІУРР, а также блочный 
квазиньютоновский метод 2-го рода (БКМ-2). Для определения ма- 

ТР ИД В* из Уравнения (V, 54) использовались формулы (11,103), 
(11,104). Поиск проводился из точки щ = 1, 2; і = 1, ..., 15; 
и і ^9’ І = всех случаях было получено значение 

целевой функции 55. Результаты счета приведены в табл. 31. Все 
функции имеют по 3$ переменных; каждая отдельная функция р> 
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Таблица 31. Сравнение эффективности метода и блочного метода БКМ-2 


Обозначение 

Значение 



Обозначение 




метода 

функ- 

ции 

функции 
в началь- 
ной точке 

«1 

к р 

метода 

функ- 

ции 

функции 
в началь- 
ной точке 

к і 

Кр 

БРР 

/ 

ш 

78 

16 

БРР 

ф 

487724 


59 

БКМ-2 

I 

НЯ 

30 

7 

БКМ-2 

ф 

487724 


23 


имеет размерность 6. Поскольку функция / является квадратичной, 
теоретически решение задачи должно было бы быть получено для к р = 
**= 7; фактически же решение получено для к р = 7. Для неквадра- 
тичной функции ф использование метода БКМ-2 позволило уменьшить 
число направлений поиска и число вычислений функции в 2 раза. 
Интересно отметить, что минимизация функции [ методом наиско- 
рейшего спуска потребовала построения 430 направлений и 1500 
вычислений функции. 


Г Л А В А VI 

Оптимальный синтез 
химико-технологических схем 


При создании новых химико-технологических схем всегда стремились 
к построению эффективных и экономичных систем. Однако эту за- 
дачу решали на основе интуиции и опыта, другими словами, на основе 
ряда простых эвристических правил, найденных эмпирически. В ка- 
честве примера приведем некоторые эвристические правила построе- 
ния реакторных схем. 

1. Если реакторный узел представляет собой последовательность 
реакторов идеального смешения, то, если степень превращения в нем 
недостаточна, необходимо увеличить число реакторов. Если же 
имеется реактор идеального вытеснения, то для повышения степени 
превращения необходимо увеличивать его длину. Однако при этом 
растут капитальные затраты. 

2. Увеличения степени превращения можно добиться, преду- 
смотрев рецикл (см. рис. 5). Это особенно важно, когда исходное 
сырье дорого и сброс непрореагировавших продуктов невыгоден. 
Создание малоотходных производств также требует введения ре- 
цикла. Однако это приводит к увеличению энергетических расходов 
на перекачку обратного потока, так что приходится искать компро- 
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Рис. ІІ. Схема реактора с тепловой об- 
ратной связью: 

1 — теплообменник; 2 ы реактор; 3 — 
делитель потока. 


мисс между увеличением сте- 
пени превращения и ростом 
капитальных и энергетических 
затрат. 

3. Тепло выходного потока реактора, в котором протекает экзо- 
термическая реакция, может быть использовано либо для подогрева 
исходной смеси (рис. 32), либо для получения пара. 

4. Применение исходной смеси для охлаждения промежуточных 
потоков в реакторе с адиабатическими слоями, в которых проте- 
кают экзотермические реакции; охлаждение может проводиться как 
с помощью теплообмена, так и смешения исходного и промежуточ- 
ных потоков (рис. 33). 

Известен ряд эвристических правил для построения схем разделе- 
ния [116] и теплообменных систем [117]. Итак, даже при построе- 
нии реакторной схемы мы сталкиваемся с необходимостью выбора 
наилучшей схемы из большого числа различных вариантов. Так, 
реакцию можно проводить в реакторах смешения или вытеснения 
либо в их комбинации, может варьироваться их число, употребляться 
или не употребляться рецикл, возможны различные схемы теплооб- 
мена исходного потока с промежуточными и выходными потоками ре- 
акторного узла. Выбор одного из огромного числа вариантов основы- 
вался на интуиции проектировщика. Теперь же ставится задача 
поручить эту творческую работу (или хотя бы ее часть) электронной 
вычислительной машине. Другими словами, ставится задача созда- 
ния теории построения (синтеза) ХТС [116], [118], [119]. При этом 
возможны два пути. Первый путь — формализация того способа 
мышления, которым пользуется человек при создании новых схем, 
формализация существующих эвристических правил, создание но- 
вых, а также разработка методов использования этих пра- 
вил, приоритета одних перед другими, и т. д. Второй путь — пол- 
ностью алгоритмический подход, состоящий в том, чтобы сформули- 
ровать проблему синтеза как математическую и развить математиче- 
ские методы ее решения. Не давая окончательного ответа на вопрос, 
какой путь лучше, приведем пример совсем из другой области. Мно- 
говековая эволюция живого мира привела к способу передвижения 
живых существ с помощью ног. Многочисленные изобретения средств 




Рис. 33. Схема адиабатического реактора с охлаждением промежуточных потоков: 

1—3 — слой катализатора; 4 — теплообменник; 5 — делитель потоков; 6 — смеситель 
потоков. 
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передвижения с помощью некоторых аналогов ног, т. е. копиро- 
вание живого мира, не приводило к хорошим результатам. Изобре- 
тение же человеком колеса — средства, которое не было создано эво- 
люцией живого мира, оказалось революционным для решения проб- 
лемы создания средств передвижения. Этот пример не должен создать 
впечатления у читателя, что авторы являются сторонниками только 
второго пути, однако здесь мы будем рассматривать только подходы 
и методы только этого пути. 

Задача синтеза ХТС может быть сформулирована следующим об- 
разом. П усть известны сходные вещества Х ь (і -- 1, р) и вещества 
У ;, (і ~ 1, т), которые требуется получить, а также имеется набор 
из N аппаратов, или блоков (реакторы, ректификационные колонны, 
теплообменники, блоки механического деления и смешения потоков 
и др.). Требуется выбрать и соединить Л^, (Ы < Л() блоков таким об- 
разом, чтобы получить заданные количества целевых продуктов 
У і, (і= 1, т), обеспечив минимум приведенных затрат на построение 
схемы (или максимум прибыли). Ясно, что число возможных вариан- 
тов схем огромно и задача синтеза схемы сводится к сложной комби- 
наторной задаче определения наилучшей схемы из огромного числа 
возможных. 

Введем понятие элементарного блока синтеза (ЭБС). Простей- 
шим ЭБС является аппарат. Но ЭБС может состоять и из нескольких 
аппаратов (блоков) с заданной структурой потоков между ними; 
тогда задача синтеза схемы сводится к определению связей между 
ЭБС, внутри же каждого из них связи остаются неизменными. При- 
меры ЭБС будут приведены ниже. Ясно, что, чем больше аппаратов 
из N возможных заключены в ЭБС, тем меньше вариантов возможных 
схем, тем проще задача синтеза. В дальнейшем для простоты изложе- 
ния часто будем говорить «блок», подразумевая элементарный блок 
синтеза. 

Перейдем теперь к математической формулировке задачи синтеза. 
Введем следующие обозначения: а — вектор, компонентами которого 
являются все величины а*/; Т - (а) — вектор, компонентами которого 
являются величины Т г <‘ь т > [см. выражение (1,7) ]. Условие (1,7) в век- 
торной записи примет вид 

1 Р(а) = 0 (VI, 1) 

Будем исходить из предположения, что математические модели 
и критерий обладают следующими свойствами: 

І (к) (О, и {к) ) = 0 Р ік) (0, 0, 0) = О (VI, 2) 

Так как после задания всех значений параметров а и управлений 
и [см. выражение (1, 15)] значение критерия Р подсчитывается с по- 
мощью уравнений (1, 1), (1 ,2),Р можно считать сложной функцией 
этих переменных Р = р (а, и). Согласно формуле (I, 4а) структур- 
ные переменные аУ] должны быть двоичными: а% = 0 или 1 . Перепи- 
шем это условие в векторной форме 


а — целое 


(VI, 3) 
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Введем множество 0° параметров а следующим образом: 

0° {а:Ч г (°0 = 0, а — целое; Ог^аг^І} (VI, 4) 

Поскольку каждому набору а, удовлетворяющему условиям (VI, 1), 
(VI, 3), соответствует какая-либо схема, то множеству 0° соответст- 
вуют все возможные варианты схем проведения процесса. Отсюда 
задача синтеза может быть записана в виде 

шіп Р (а, и) (VI, 5) 

В отличие от структурных переменных а, которые в данном случае 
являются дискретными, поисковые переменные будем называть 
технологическими, поскольку в качестве и используются обычно 
температуры, давления, расходы и конструктивные параметры. Как 
правило, это непрерывные переменные, хотя по условиям задачи неко- 
торые из конструктивных параметров могут принимать только диск- 
ретные значения (например, в соответствии с ГОСТ, длины и диаметры 
труб теплообменников могут принимать только дискретный ряд зна- 
чений). 

Задача (VI, 5) относится к многоразмерным дискретно-непрерыв- 
ным экстремальным задачам, методы решения которых еще не полу- 
чили такого развития, как в случае непрерывных экстремальных 
задач. Остановимся на математических методах, которые исполь- 
зуются для решения задач синтеза. 

Методы дискретной математики [120] (целочисленное линейное 
программирование, методы поиска на дереве решений [121, с. 82], 
в том числе методы «ветвей и границ» [120, с. 213] и др.), использо- 
вание которых обусловлено комбинаторным характером проблемы. 

[ Локальные поисковые методы с непрерывными поисковыми пере- 
менными (см. гл. III, IV), получившие большое развитие в последние 
годы. Чтобы получить возможность их использования, желательно 
сводить задачу синтеза ХТС к экстремальной непрерывной задаче. 

Методы поиска глобального экстремума [12, с. 491 — 535]. При 
оптимизации систем фиксированной структуры обычно используются 
локальные методы поиска, поскольку при этом либо известно хоро- 
шее начальное приближение, либо задача носит одноэкстремальный 
характер. Задачи же синтеза часто имеют многоэкстремальный ха- 
рактер, что существенно усложняет их решение [122] и приводит 
к необходимости применения методов глобальной оптимизации. 

Метод погружения [І23], часто используемый, когда первона- 
чальную задачу заменяют более общей, имеющей развитые методы 
решения. При этом решение общей задачи дает решение и частной 
задачи. Н[а этом принципе построен метод динамического программи- 
рования [124]. В данном случае эта идея реализуется следующим 
образом. Строится некоторая схема (назовем ее глобальной, 
или интегральной), которая охватит все частные схемы рас- 
сматриваемой задачи синтеза. Причем любую частную схему можно 
получить из глобальной, если некоторым параметрам (будем назы- 
вать их структурными) давать определенные значения. Тогда 
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оптимизация глобальной схемы будет давать решение исходной за- 
дачи синтеза. Ясно, что глобальная схема должна строиться таким 
образом, чтобы можно было использовать развитые методы оптими- 
зации, например нелинейное программирование, целочисленное 
линейное программирование и т. д. 

Метод закрепления. Коротко он был рассмотрен в гл. V примени- 
тельно к задаче оптимизации схем фиксированной структуры с не- 
прерывными переменными, однако, он имеет силу и для решения 
задач синтеза. Действительно, рассмотрим схему, приведенную на 
рис. 22. Под отдельным блоком этой схемы будем понимать какую- 
либо подсхему. Закрепим все входные и выходные переменные блоков 
этой схемы. Поскольку при этом ликвидируется взаимное влияние 
блоков, улучшение структуры подсхемы относительно локального 
критерия не будет противоречить глобальному критерию. 

Сложность задач синтеза требует максимального использования 
специфики при решении каждой отдельной задачи. В связи с этим по- 
лучили большое развитие методы синтеза гомогенных схем, т. е. 
схем, состоящих из однородных аппаратов; примером могут служить 
теплообменные системы (ТС) [46, с. 257 — 308], системы разделения 
[125]. Рассмотрим методы синтеза как гетерогенных систем, т. е. 
схем состоящих из разнотипных аппаратов, так и гомогенных систем. 


Двухуровневый подход 

Задача синтеза (VI, 5) записывается в виде следующей двухуровне- 


вой процедуры: 


тіп тіп Р (а, и) 
а ^ 0° и 6 и 


(VI, 6) 


На первом уровне при фиксированных а проводится минимиза- 
ция функции Р по непрерывным переменным и [1, с. 304 — 306]. 
Поскольку задача оптимизации Р при фиксированных а соответст- 
вует оптимизации некоторой схемы фиксированной структуры, на 
первом уровне могут использоваться хорошо разработанные методы 
оптимизации схем фиксированной структуры (см. гл. I — IV). Введем 
обозначения 

Р*-(а)ш тіп Р (а, и) 

-«€ и 


тогда на втором уровне должна решаться задача 

тіп Р*(а) (VI, 7) 

а ^ О» 

Таким образом, задача второго уровня сводится к минимизации 
нелинейной функции двоичных переменных. Одним из ^подходов к ре- 
шению задач второго уровня (VI, 7) является полный перебор всех 
вариантов схем. 


Полный перебор вариантов схем 

Основная цель состоит в формализации процедуры перебора, кото- 
рая обеспечивала бы получение всех допустимых вариантов схем. 
Для этого удобно использовать специальный вид ориентированного 

ИІ 




Рис. 34. Ориентированный граф-дерево. 


графа, называемый д е ревом (рис. 34). Дерево характеризуется 
следующими свойствами: 1) имеет одну корневую вершину Лп; 2) все 
ребра направлены сверху вниз, поэтому стрелки не показаны; ’з) каж- 
дая вершина имеет только одно входное ребро. Вершина называется 
висячей, если она не имеет выходных ребер. Назовем к - тым 
уровнем дерева совокупность вершин графа, обладающих таким 
свойством: число ребер, соединяющих вершину Л° с любой вершиной 
к-го уровня, равно к (рис. 34). Будем считать, что в дереве имеется 
Я уровней. Вер шины /-го уровня обозначим через А[ (где / — номер 
уровня, і, ( і = 1, /п/) номер вершины данного уровня; т — число 
вершин на /-том уровне). Если ребро соединяет вершину А[ с верши- 
ной Ар ', то будем говорить, что А { — предшествующая 
вершина, а А у —потомок вершины А\. Пусть р[ — число 
потомков вершины Л{, а МІ — множество номеров вершин (/ + 1)-го 
уровня, являющихся потомками вершины А[. Будем называть де- 
ревом вариантов дерево, с помощью которого мо- 
гут быть перечислены все варианты схем. Рассмотрим три их 

1-й тип дерева вариантов. В этом случае вершина Ло соответ- 
ствует все множество вариантов_схем, а вершине А[ некоторое его 
подмножество. Обозначим через А{ множество схем, соответствующих 
вершине А\. В построении дерева вариантов основным является пра- 
вило, согласно которому строятся потомки любой вершины Такие 
правила могут иметь самый разный характер, однако они должны 
удовлетворять следующим трем условиям, 
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1 . Множество схем, соответствующих любому потомку вершины 
А[ является подмножеством схем, соответствующих вершине А\ 

Ар'сЩ Р ем{ (VI, 8) 

2. Сумма множеств, соответствующих всем потомкам вершины А{, 
равна множеству, соответствующему вершине А[ 

Л'= у А>+ % (VI, 9) 

р € м{ 

3. Ни одна из схем не может одновременно входить в два подмно- 
жества, соответствующие двум потомкам вершины А[ 

Ц +1 [\А^ = 0 р, д$м{ (VI, 10) 

Ясно, что если вершине соответствует только одна схема, то она 
не имеет потомков и является висячей. Для примера приведем одно 
правило построения потомков. Согласно этому правилу, каждая 
вершина за исключением висячих имеет два потомка, одному из 
которых соответствует множество схем, в которых обязательно. при- 
сутствует некоторый поток, а другому потомку — множество схем, 
в котором указанный поток отсутствует. Итак, каждому из двух 
ребер, выходящему из вершины А[, соответствует одно условие 
(наличие потока в схеме или его отсутствие) построения схемы. 
Отсюда следует, что совокупность ребер, входящих в путь от вер- 
шины Ло до любой висячей вершины А{, полностью характеризует 
схему, соответствующую этой вершине. Ясно, что в данном случае 
число уровней будет равно числу возможных потоков. Если в схеме 
имеется N аппаратов, каждый из которых имеет только один Выход- 
ной поток, то число возможных потоков будет равно N (Ы — 1) и, 
следовательно = N (Ы — 1). 

2- й тип дерева вариантов. В этом случае каждой вершине А{ 
ставится в соответствие только одна схема А\. Потокам Л^ +1 , (р ^ 
6 М()_вершины А'і соответствуют схемы, которые получаются из 
схемы А'і добавлением одного аппарата в соответствии с каким-либо 
формализованным правилом. 

Расширение схемы продолжают, пока не будут исчерпаны все 
аппараты, из которых должна быть построена схема. Естественно, 
что вершины последнего уровня будут висячими. Дерево вариантов 
2-го типа было построено для задачи синтеза теплообменных си- 
стем [136]. 

3- й тип дерева вариантов. Ребра этого дерева соответствуют 
некоторым потокам. Для простоты изложения будем говорить, что 
в данную вершину входит (или из нее выходит) ребро, соответству- 
ющее этому потоку. Граф будет иметь вершины трех типов. Каждой 
вершине первого типа будет соответствовать какой-либо один аппа- 
рат. Если поток, выходящий из вершины 1-го типа, не требует даль- 
нейшего преобразования, то ребра, выходящие из такой вершины, 
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Рис. 35. Дерево вариантов схем разде- 
ления четырехкомпонентной смеси: 

вершины: д — 1-го типа; □ — 2-го 

типа; О — 3-го типа. 

попадают либо в висячую 
вершину (относится к 3-му 
типу), либо в вершины 2-го 
типа. В этих вершинах надо 
принять следующее решение: 
в какой из еще не использован- 
ных аппаратов подать поток, 
выходящий из вершины 1-го 
типа. Здесь путь от верши- 
ны Ло до промежуточной вер- 
шины А{ будет соответствовать 
части некоторой схемы. Путь 
от А 0 до некоторых висячих 
вершин будет соответствовать 
полной схеме. 

Приведем пример дерева 
этого типа. На рис. 35 пока- 
зано дерево вариантов все- 
возможных схем, состоящих 
из ректификационных колонн, 
ДЛЯ разделения четырехкомпонентной смеси 
(аЬсй), где а, Ь, с, й — некоторые компоненты; над каждым 
ребром вписана соответствующая смесь. К вершинам 1-го типа 
принадлежат А і, Лг, Лз, Лз и др. Вершине Л | соответствует ректи- 
фикационная колонна, в которой смесь (аЬсО) делится на потоки а и 
(оса), эту операцию будем обозначать через (а\ЪсО). К вершинам 
2-го типа принадлежат Л°, А%, Аі- Из Л° ребра попадают в вершины 
А і. А- 2 % Лз, соответствующие ректификационным колоннам, в ко- 
торых смесь (аЬсО) делится соответственно, следующим образом: 
(а^Ьсй), (аЬ\сО), ( аЬс\й ). К вершинам 3-го типа принадлежат Л?, 
Л 6 , ц Л і , Л і и др. Путь ЛоЛ'і соответствует схеме разделения, состоя- 
щей из 3-х ректификационных колонн, в которых разделение смеси 
проводится в следующей последовательности: (а\ЬсО), (Ь\сО), ( с\й ). 

После того, как дерево вариантов одного из трех типов построено 
процедуру перебора вариантов легко формализовать. Действи- 
тельно, согласно способу построения любого из трех типов деревьев 
совокупность всех (или некоторых) висячих вершин дерева соот- 
ветствует всем возможным вариантам схемы. Отсюда становится 
ясным принцип перебора — необходимо просмотреть все висячие 
вершины дерева. Для этого может быть использован так называе- 
мый перебор «в глубину» [121, с. 103], при котором последовательно 
просматриваются пути, связывающие вершину Л° со всеми вися- 
чими вершинами. При использовании дерева 2-го типа, когда каж- 
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дой вершине соответствует какая-либо схема, возможен также 
перебор «в ширину» [121, с. 102], при котором последовательно 
просматриваются сначала вершина А\, потом все вершины, на- 
чиная с первого уровня и кончая последним. В данном случае 
возможен также перебор «на глубину к», когда просматриваются 
перебором «в ширину» все вершины от нулевого до к - го уровня. 
Из этих вершин выбирается та, которой соответствует наилучшая 
схема, и из нее производится перебор «в ширину» вершин следу- 
ющих к уровней и т. д. 

Несмотря на то, что процесс перебора поддается полной форма- 
лизации, его нельзя применять в любом блучае, поскольку число 
вариантов схем может быть астрономическим. Так например, если 
число аппаратов (Ѵ=10 и все аппараты имеют по одному выходу, 
то число Р структурных параметров а будет равно УѴ 2 =100. 
Каждый параметр может принимать значение 0 или 1, поэтому с 
учетом ограничений (I, 7) общее число вариантов будет равно 100! 
Отсюда ясно, что полный перебор неприемлем даже для такой срав- 
нительно небольшой задачи. Необходимы средства, которые суще- 
ственно ускоряли бы процедуру перебора. Рассмотрим два из них: 
метод ветвей и границ [127, с. 299] и метод отсечения неперспек-. 
тивных вариантов. 

Метод ,, ветвей а границ ' ‘ 

Процедуру метода «ветвей и границ» удобно представить в виде 
дерева решений (рис. 36). В отличие от дерева вариантов 
(рис. 34) вершины дерева решений будут иметь либо два, либо один, 
либо ни одного потомка. Так же,_как и в дереве вариантов, вер- 
шине Ло соответствует множество А° всех схем, которые можно со- 
ставить из N блоков, а вершине А{ — некоторые^ подмножества 
схем АІ(Аі а Ло). Внутри каждого подмножества А{ введем свою 
нумерацию схем, через а[к обозначим &-тую схему множества А{- 
Пусть Р* {аІь) — оптимальное значение критерия (1,15) для 
схемы а'іь 

Р* ( а [ к ) = шіп Р (а, и) ‘ (VI, 11) 

О і 

Нижней оценкой р* множества А[ (вершины А\) называется 
число, обладающее свойством 

Р { =57^* = тіп Р * (а[ к ) (VI, 12) 

Если Лр +1 является потомком А{, то А' р +1 ^ М\ отсюда вы- 
текает очевидное неравенство 

Р' р +1 > р{ (АІ+ Х ^Л) (ѴП 13) 

Величина р{* является оптимальным значением критерия для 
наилучшей схемы из множества А\. Будем называть эту величину 
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Рис. 36. Дерево решений. 



нижней гранью множе- 
ства А[. В процедуре метода 
ветвей и границ /-му шагу 
соответствует /-тый уровень 
дерева решений (см. рис. 36). 
На каждом шаге этой про- 
цедуры проделываются сле- 
дующие операции. 

1. Находятся нижние оценки_р( всех множеств АІ, ( і = 1, т 

2. Определяется множество А' р ., для которого нижняя оценка 
будет наименьшей, т. е. существует неравенство 


»'=1. т { (VI, 14) 

Это множество будем называть «оптимальным», а соответству- 
ющую вершину — «оптимальной». Заметим, что если бы в соот- 
ношении (VI, 12) выполнялось точное равенство, то оптимальная 
схема 'обязательно принадлежала бы «оптимальному» множеству. 
В этом случае дальнейшему рассмотрению необходимо было бы 
подвергнуть только множество А' р ., отбросив все остальные, как 
заведомо не содержащие оптимальной схемы. В случае же неравен- 
ства не исключена возможность того, что в действительности опти- 
мальная схема не принадлежит множеству Ар. (чем ближе вели- 
чина р( к Р'і , тем менее вероятна такая ситуация), что заставляет 
анализировать и «неоптимальные» множества ~А{, ( і ф рф Разобьем 
неоптимальные вершины на перспективные и неперспективные 
вершины. Вершину А[, ( і Ф р ^ будем называть неперспективной, 
если множество А[ заведомо не содержит оптимальной схемы. Если 
множество Л (.вообще говоря, может содержать оптимальную схему, 
то вершину А'і, ( і ф р у ) будем называть перспективной. 

3. Проверяется критерий окончания процедуры. При его выпол- 
нении оптимальная схема найдена и поиск прекращается. В про- 
тивном случае осуществляется_переход к следующей операции. 

4. Оптимальное множество А р . разбивается на два подмноже- 
ства. Соответствующие этим двум подмнбжествам вершины будут 
принадлежать (/ + 1)-му уровню. 

5. Среди неоптимальных вершин определяются перспективные 
и неперспективные. Неперспективные исключаются из рассмотре- 
ния, а для каждой перспективной вершины А{, ( і Ф^ р ; ) образуется 
один потомок А[ +х , которому соответствует то же множество схем, 
что и вершине Л(, (Л( = А'„ + \ ц ф Рі ). 
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Так, на рис. 3? множество АІ предполагается оптимальным и 
вершина Аз имеет два потомка, а неоптимальные вершины АІ, А\ 
предполагаются перспективными, они имеют по одному потомку. 
Итак, для выполнения процедуры метода «ветвей и границ» необ- 
ходимо иметь следующие алгоритмы: 

1) способ определения нижних оценок; 

2) правило разбиения «оптимального» множества (правило вет- 
вления); 

3) критерий окончания процедуры; 

4) способ определения перспективных и неперспективных 
среди «неоптимальных» вершин. 

Опишем теперь общие подходы, которые могут быть положены 
в основу построения этих алгоритмов. 

Определение нижней оценки. Пусть имеется задача 

тіп / (х) х^О (VI, 15) 

и требуется найти нижнюю оценку функции / (х) на множестве 
(области) О. Рассмотрим три способа определения нижней оценки. 

1 способ — переход к большей области. Пусть имеется множе- 
ство О, такое, что О сі О, тогда выполняется очевидное соотношение 

тіп / (х) тіп / (х) О а О (VI, 16) 

х ^0 х (; С 

Отсюда следует, что в качестве нижней оценки функции / (х) на 
множестве О может быть взята величина 

р = тіп / (х) (VI, 17) 

х^о 

При решении задачи (VI, 17) необходимо искать глобальный ми- 
нимум. Область О выбирается так, чтобы решение задачи (VI, 17) 
было в каком-то смысле проще решения задачи (V, 15). Так напри- 
мер, если О — невыпуклая область, то задача (VI, 15) может иметь 
несколько минимумов и для ее решения необходимо использовать 
сложные нелокальные методы спуска. Если в качестве О взять вы- 
пуклую область, то для решения задачи (VI, 17) можно воспользо- 
ваться хорошо разработанными методами локального спуска. 

2 способ — переход от целочисленных переменных к непрерыв- 
ным. Пусть, например, область О представляет собой совокупность 
точек с целочисленными координатами, лежащими в некотором 
гиперкубе 

О = {х : аі ^ хі ^ Ьі Хі — целые) (VI, 18) 

При этом различают два случая. В первом из них функция / (х) 
определена и может быть рассчитана во всех точках гиперкуба; 
в точках с нецелочисленными координатами она либо не имеет 
физического смысла, либо же не может реализоваться в силу каких- 
либо условий (например, дискретность значений длин и диаметров 
труб теплообменников, определяемых ГОСТом). Здесь мы имеем 
дело с частным случаем 1-го способа, поскольку от минимизации 
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в области О мы переходим к минимизации а области О, определяй* 
мой условиями 

0 = {*: (VI, 19) 


Ясно, что С с О и величина р из выражения (VI, 17) будет ниж- 
ней оценкой функции / (х). Более сложным будет случай, когда 
функция / (х) не определена в точках с нецелочисленными коорди- 
натами; здесь необходимо построить такую функцию I (х), которая 
совпадает с значениями функции / (х) в точках с целочисленными 
координатами и определена в остальных точках гиперкуба (VI, 19): 


/ (X) = 


/ ( х ), если х ^ О 
определена, если х 670 


(VI, 20) 


Ясно, что в качестве нижней оценки в этом случае может быть 
взята величина 

р = тіп/(х) х(^0 (VI, 21) 

х 

3 способ — переход от конечномерных задач к бесконечномер- 
ным. Известные задачи определения оптимального профиля темпе- 
ратур, давлений, нагрузок реактора [128, с. 46] по существу дают 
нижнюю (верхнюю) оценку для всевозможных стратегий изменения 
указанных параметров по длине реактора. 

В заключение отметим, что задача разработки алгоритма нахо- 
ждения нижних оценок множеств является центральной и наиболее 
сложной из возникающих при использовании метода ветвей и гра- 
ниц. К сожалению, именно эта часть процедуры является нестан- 
дартной, и ее приходится разрабатывать для каждой задачи в от- 
дельности. От того, насколько эффективной будет эта процедура, 
во многом зависит успех применения метода ветвей и границ. Причем 
при разработке этого алгоритма приходится решать компромиссную 
задачу. С одной стороны, чем точнее алгоритм, т, е. чем ближе ве- 
личина р]- к точке нижней грани Р'* , тем больше вероятность 
нахождения оптимальной схемы в множестве А'„. и тем меньше 
будет ложных ветвлений. С другой стороны, более точный алгоритм 
обычно требует больше времени для определения р{. 

Окончание процедуры поиска оптимальной ХТС определяется 
следующими условиями. 

1. Среди схем множества А р . найдена схема номер I, для которой 
выполняется условие 

рр,.=п; п) = р ' ш (ѵі, 22) 


2. Среди схем множества А’ р . найдена схема номер I, для которой 
выполняется условие 

К-'Н-УІ 

где е — достаточно малая величина. 
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(VI, 23) 


Действительно, пусть выполняется условие (VI, 22), тогда 1-ая 
схема является наилучшей среди схем множества А' р .. С другой 
стороны, в соответствии с неравенством (VI, 14) ни в одном из мно- 
жеств А'і, ( і Ф р-) не найдется схемы, лучшей чем а'ц. В частности 
условие (VI, 22) выполняется, если в результате предыдущих деле- 
ний множество А’р. оказалось состоящим только из одной схемы. 
В случае выполнения условия (VI, 23) можно показать, что нельзя 
найти схему, для которой выполнялось бы условие 

р Нк) < р («у -- е я * р, 

Отсюда следует, что в качестве оптимальной с достаточной точ- 
ностью может быть принята схема а' р р. 

Правило разбиения «оптимального» множества (правило ветвле- 
ния). Поскольку в оптимальной вершине соответствующее множе- 
ство делится на два множества, то иногда говорят о ветвлении 
в «оптимальной» вершине, а правило разбиения называют правилом 
ветвления. Для формализации процедуры ветвления введем вектор 
параметров б, компоненты которого 8*, (і = Т, р ) могут принимать 
значения 0 или 1. Задание фиксированных значений 0 или 1 для 
одного или нескольких из этих параметров будет выделять среди 
множества схем Л о некоторое подмножество. В отличие от структур- 
ных параметров параметры 6; будем называть структурными пара- 
метрами 2-го рода, их смысл будет конкретизироваться в каждом 
отдельном случае. 

Структурный параметр 2-го рода будет характеризовать про- 
цедуру ветвления в «оптимальной» вершине. Так, множество схем, 
соответствующее потомку Л 7 ? +1 оптимальной вершины А' р . будет 
характеризоваться тем, что для него один из параметров (например, 
б 8 ) будет принимать значение 1; множество схем, соответствующее 
другому потомку А'г +Х , будет характеризоваться значением 8 3 = 0. 
Параметр б 8 будем называть параметром ветвления вершины А' р . 
(множество А'р?). Кроме того, будем говорить, что ребрам А’ р ., А' д +1 и 
А'р., А'г +{ соответствуют значения параметра 8 3 , равные 1 и 0, соот- 
ветственно. Итак: каждой «оптимальной» вершине будет соответ- 
ствовать свой параметр ветвления. Множество схем А{ будет харак- 
теризоваться некоторым множеством Ь) 0[ параметров 8 д . 

Это множество будет формироваться следующим образом. Рассмо- 
трим путь АІА'і, связывающий вершины Л° и Л{ на дереве решений 
(см. рис. 36). Занесем в множество значения параметров ветвле- 
ния, соответствующих всем ребрам, принадлежащим этому пути 
и выходящим из «оптимальных» вершин этого пути. В общем случае 

будет иметь вид 





(VI, 24) 
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Множество будет содержать все б,-, не вошедшие в 


*>'і = {?< : 5 с * 

Ясно, что Ио = 0. Пусть параметром ветвления множества 
был параметр 8 г , причем схемы множества А\ характеризуются тем, 
что для^них б/ = 1, а для схем множества А\ б ; = 0, тогда ПІ = \8 : — 
= 1}, БІ = {8 : — 0}. Пусть на первом уровне вершина А\ — «опти- 
мальная», а ее параметром ветвления является параметр 8 Г . Пусть 
схемы множества А\ характеризуются тем, что для них б г = 1, а 
для схем множества А\ 8 г — 0. Тогда = {8, = 1, б г = 1}, 7 )\ = 
= {б/_= 1 , б г = 0}. Поскольку множества А\ и А\ совпадают, то 
Щ = Ъ\. В дальнейшем нам понадобится вспомогательный вектор 
А' = {б ( , • • ■ , б р [, компонентами которого будут структурные 


параметры б 


6й = 


8 к , если 8 к ^О{ 
1, если б к (іЩ 


(VI, 25) 


Определение неперспективных неоптимальных вершин. Для про- 
верки критерия окончания процедуры поиска [по условию (VI, 23)] 
в каждой «оптимальной» вершине всегда будем брать некоторую 
схему а’рТі, для которой будем рассчитывать оптимальное значение 
критерия Р* (а'рГі). В каждом отдельном случае правило выбора 
этой схемы будет различным. Из определения нижней оценки выте- 
кает, что если выполняется неравенство 



то все схемы множества А\ хуже, чем схема а' р .і. Отсюда следует, 
что все вершины, в которых удовлетворяется это условие — непер- 
спективны и должны быть исключены из дальнейшего анализа. 


Метод отсечения неперспективных вариантов 

Метод отсечения неперспективных вариантов применяется к дереву 
вариантов 3-го типа. Для иллюстрации рассмотрим пример дерева 
вариантов схем разделения (см. рис. 35). Обозначим через р[* за- 
траты на часть схемы, соответствующую пути Если вершина А ч р 

принадлежит пути АІА[, то подсхема, соответствующая пути АоА% 
является частью подсхемы, соответствующей пути АІА'і. Поскольку 
на часть схемы всегда приходятся меньшие затраты, чем на всю 
схему, справедливо соотношение 

На основе этого неравенства может быть построено правило 
отсечения неперспективных вариантов. Действительно, пусть из- 
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вестны затраты р'а на полную схему, соответствующую Некоторой 
висячей вершине А а. Пусть в некоторой вершине А ч р соблюдается 
неравенство 

рі* > Р ь * 

В этом случае нет смысла рассматривать всех потомков вер- 
шины Ар, а также потомки ее потомков и т. д., поскольку соответ- 
ствующие схемы будут хуже, чем схема, соответствующая висячей 
вершине А ь а . Поясним это правило на примере дерева вариантов 
схем разделения (см. рис. 35). Пусть для просмотра вариантов ис- 
пользуется перебор «в глубину» и определен первый путь АоА°, 
которому соответствует схема разделения с затратами После 
этого двигаясь из вершины Ло, следует проверить путь, проходя- 
щий через вершину Л|. Если окажется, что Е|* > ЕІ*. то вер- 
шину Лз можно не рассматривать, поскольку по ее достижении 
стоимость схемы может только возрасти [ 1 29 1. Общая 'схема при- 
менения этого правила будет следующая. Во время перебора «в глу- 
бину» в качестве верхней границы берутся наименьшие величины 
из затрат, соответствующих просмотренным схемам. Если во время 
перебора в некоторой промежуточной вершине величина затрат 
окажется выше верхней границы, то продолжать просмотр потом- 
ков этой вершины нет необходимости. 

Остановимся теперь на способе вычисления величины Р ч р *, вос- 
пользовавшись схемой, приведенной на рис. 35. Будем исходить 
из предположения, что каждая колонна обладает высокой разде- 
лительной способностью и во всех колоннах давление одинаково 
(изобарическая схема разделения). Рассмотрим вначале отдельную 
колонну, пусть это будет ректификационная колонна соответству- 
ющая вершине Лз (см. рис. 35). При достаточной степени чистоты 
дистиллята и кубового продукта с некоторым приближением можно 
считать, что дистиллят состоит только из компонент аЬс (причем 
величины этих компонент будут равны их значениям на входе в ко- 
лонну), а кубовый продукт — из компоненты й. Температура ди- 
стиллята будет равна температуре точки росы или кипения смеси аЬс, 
а кубового продукта — температуре кипения вещества й. Поэтому, 
как бы мы ни варьировали параметры колонны, ее выходные пере- 
менные будут постоянны и оптимизация никак не повлияет на ре- 
жим работы остальных колонн. Таким образом, при оптимизации 
изобарической схемы ректификационных колонн каждую колонну 
можно оптимизировать отдельно. Отсюда возможен следующий 
простой способ вычисления Р{* . Пусть Р 1 * подсчитано и необходимо 
вычислить Е</ +!) \ где Л' +1 — потомок вершины А{. Для этого 
надо провести оптимизацию колонны, соответствующей вершине Л^ +1 > 
и величину полученных затрат для этой колонны прибавить 
к Р{*. 
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Метод структурных параметров 

Будем исходить из предположения, что в задаче (VI, 5) проводится 
одновременная минимизация по дискретным переменным а и непре- 
рывным переменным и (одноуровневый подход). Рассмотрим метод 
решения этой задачи, основанный на замене целочисленных перемен- 
ных непрерывными [130], т. е. тот, который рекомендовался для 
получения нижних оценок в процедуре метода «ветвей и границ». 
Итак, будем считать структурные параметры непрерывными, удо- 
влетворяющими условиям 

О^аесі (VI, 26) 

Тогда полученная задача может быть записана в виде 


где 


шіп Р (а, и) (VI, 27) 

сс^дЦ, и 6 и 

Оо = {« :Ч г (а) = 0, О^а^І} (VI, 28) 


'Дадим задаче (VI, 27) схемную интерпретацию. Будем считать' 
что стоимость узлов смешения и деления потоков намного меньше 
стоимости остальных аппаратов и ею можно пренебречь (в большин- 
стве случаев это так). На каждом входном потоке схемы поставим 
мнимый входной блок; через каждый из таких блоков потоки веществ 
проходят без всякого преобразования. Новый ЭБС построим следу- 
ющим образом. На каждом выходном потоке каждого оставшегося 
и мнимого блока поставим делитель, который будет распределять 
поток между входами всех блоков (за исключением мнимых), а на 
входном потоке каждого блока предусмотрим блок смешения, куда 
будут поступать доли потоков из всех блоков схемы. Совокупность 
блока, всех его выходных делителей потоков и входных смесителей 
потоков и будет новым ЭБС. Теперь становится ясным смысл вве- 
дения мнимых входных блоков — он состоит в обеспечении воз- 
можности разветвления входных потоков схемы. Обозначим через а % 
величину, удовлетворяющую условию (VI, 26) и показывающую, 
какая часть /-го выходного потока і-то блока подается на з-тый вход 
к - го блока. 

Из уравнений материального баланса делителя потоков, стоя- 
щего на д-том выходном потоке т-то блока, и смесителя потоков, 
стоящего на з-том входном потоке к-ѵо блока, легко получить соот- 
ношения (I, 7), (1, 4) соответственно. Таким образом, эти соотношения 
соблюдаются, когда структурные переменные являются как двоич- 
ными, так и непрерывными, удовлетворяющими условиям (VI, 26). 
Поскольку при различных значениях параметров из этой схемы 
могут быть получены все возможные варианты, построенная схема 
будет глобальной. 

Рассмотрим в виде примера задачу построения схемы, состоящей 
из трех аппаратов (рис. 37) (реактора идеального смешения, реак- 
тора идеального вытеснения, сепаратора и необходимого числа сме- 
сителей и делителей потоков. Пусть в обоих реакторах протекает 
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Рис. 37. Совокупность блоков, из 
которых должна быть построена 
схема получения продукта В из 
вещества А : 

I — мнимый блок (на схеме не 
показан); 2 — реактор идеального 
смешения; 3 — реактор идеаль- 
ного вытеснения; 4 — сепаратор. 

Пунктиром ограничена совокуп- 
ность блоков, введение связей 
между которыми определяет некото- 
рую схему проведения процесса. 

необратимая изотермическая реакция первого порядка А В. 
Вещество В является целевым. В сепараторе поток вещества А 
отделяется от потока вещества В. Возможны различные способы 
организации схемы процесса. Исходный поток А можно подать 
вначале в реактор идеального смешения, а потом в реактор идеаль- 
ного вытеснения, либо в обратном порядке, либо его можно распре- 
делить между этими реакторами; можно вообще не использовать 
один из реакторов; поток между реакторами можно разделить, и 
часть его направить в сепаратор; непрореагировавшее вещество после 
сепаратора можно подать обратно на вход одного из двух реакторов; 
можно организовать частичный рецикл потока до его подачи в сепа- 
ратор и т. д. 

Построим глобальную схему для этой задачи синтеза. На вход- 
ных потоках блоков 2 — 4 поставим смесители 5 — 7 (рис. 38), а на 
выходных потоках — делители потоков 9 — 11. Введем мнимый 
блок 1, на выходном потоке которого поставим делитель 8, цель 
которого — разделить исходный поток вещества А на два потока, 
подаваемых в блоки 2, 3. Все возможные варианты схем данной 
задачи содержатся в глобальной схеме, приведенной на рис. 38. 
Здесь через х[ к \ х (к) обозначены величины потока веществ А, В 
на входе к- го блока, а через у \ к) , уі к) потоки веществ А, В на выходе 
к - го блока. Поисковыми переменными будут структурные параметры 
а*;, а также объемы реакторов. Элементарными блоками синтеза 
здесь являются совокупность блока і ( і — 2, 3, 4), смесителя і + 3 и 
делителя і + 7, а также блок 1 и делитель 8. 


ТУ Ч 3 н чи> 


. л 


«23У <3) 



Рис. 38. Глобальная схема получения продукта В из вещества А (см. рис. 37): 

1 _ мнимый блок; 2 — реактор идеального смешения; 3 — реактор идеального вытеснения; 
(| — сепаратор; 5—7 — смеситеди; 5 — // — целители потоков, 
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Задача оптимизации глобальной схемы будет иметь вид (VI, 27). 
Поскольку в этом случае все переменные являются непрерывными, 
для решения могут быть использованы хорошо разработанные чис- 
ленные методы нелинейного программирования (см. гл. III, IV). 
Ясно, что в результате решения могут быть получены нецелочислен- 
ные значения <4' ь принимающие любые значения в интервале 
(VI, 26). Если условия задачи допускают любые значения структур- 
ных параметров в интервале (VI, 26), то полученный результат 
будет решением первоначальной задачи (VI, 5). При этом, если ка- 
кие-либо структурные параметры с4/ при к = к ъ . . ., к р ; з = Т7Ж 
примут нецелые значения, то на /-том выходе і-го блока необходимо 
поставить делитель потока, а на входных потоках блоков к ъ . . ., к р 
смесители. В дальнейшем этот метод будем называть методом струк- 
турных параметров (МСП). Рассмотренный подход выглядит очень 
заманчивым, поскольку позволяет сводить многомерную комбина- 
торную задачу к задаче нелинейного программирования. Особенно- 
сти этой задачи состоят в следующем: 

1. Задача синтеза ХТС сводится к задаче нелинейного програм- 
мирования (VI, 27) большой размерности. Если ХТС должна быть 
синтезирована из N блоков, то число Р структурных параметров от- 
будет равно V 2 + йѴ (где к — число входных потоков в схему). 
Так, даже для сравнительно небольшой задачи, когда N = 10, 
к = 1, число структурных параметров будет равно ПО. В связи 
с этим для эффективности решения задач синтеза ХТС очень важно 
развитие методов решения поисковых задач большой размерности 
(см. гл. V). 

2. В задаче нелинейного программирования (VI, 27) на все струк- 
турные переменные наложены простейшие ограничения, имеющие 
вид неравенств типа «больше — меньше», а также линейные ограни- 
чения типа (I, 7). Использование метода штрафа и метода уровней 
для учета этих ограничений может существенно ухудшить харак- 
теристики поиска, поэтому при решении задач синтеза важную 
роль должны играть методы поиска с непосредственным учетом 
линейных ограничений. 

3. Использование МСП часто сводит задачу синтеза к много- 
экстремальной задаче, что существенно усложняет ее решение, 
поскольку требует применения методов глобальной оптимизации 
[ 122 ]. 

4. В ряде случаев МСП в принципе не может преодолеть комби- 
наторный характер задачи синтеза ХТС. 

Обобщение метода структурных параметров 

Рассмотрим ряд важных для практических приложений случаев, 
когда МСП не позволяет полностью преодолеть комбинаторный 
характер задачи синтеза [132 — 134]. 

Случай 1. В результате решения задачи (VI, 27) оптимальные 
значения а* структурных параметров могут принять нецелые зна- 
чения. Имеется, однако, ряд случаев, когда требуется, чтобы приц- 
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Ципиально выполнялось требование целочисленности параметров а. 
Эти требования могут возникнуть, если по тем или иным причинам 
нельзя смешивать некоторые потоки, например, вследствие взрыво- 
опасности, или при применении МСП в задаче синтеза теплообменных 
систем. Пусть решение задачи (VI, 27) дало нецелые значения а*, 
что может быть в частности следствием неполной сходимости к ре- 
шению. В работе [130] предлагается использовать инженерную 
интуицию для решения вопроса о том, какие значения (0 или 1) 
должны принять структурные параметры а 1} . Однако использование 
этой рекомендации не всегда приведет к правильным результатам. 
Простое же округление полученных значений а*,- до ближайших 
целых чисел может привести к неправильным результатам [120, 
с. 17]. Возникает сложная проблема нахождения целых значений а, и 
по полученным нецелым значениям а*/. Решение этой задачи 
требует перебора различных вариантов значений структурных 
параметров ссц. 

Случай 2. Наличие фазовых ограничений (I, 11) также суще- 
ственно' затрудняет применение МСП. В работе [131] было пока- 
зано, что применение этого метода в задаче синтеза теплообменных 
систем может дать неоптимальное решение при наличии ограниче- 
ний на входные и выходные температуры теплообменников. Такая 
же ситуация может возникнуть и при его применении для синтеза 
более общих схем а случае наличия ограничений на фазовые пере- 
менные. Действительно, подставим в уравнение (I, 81 1) выражение 
для из формулы (1,6) 

Ф (А) а « г</) I (VI, 29) 

Из этого соотношения видно, что наличие фазовых ограничений 
в &-том блоке по существу накладывает ограничение на работу 
всех блоков схемы, поскольку в левую часть неравенства (VI, 29) 
входят выходные переменные всех блоков схемы. Пусть задача 
синтеза ХТС решена с помощью МСП и получено ы (А) = 0. Несмо- 
тря на то, что в этом случае = 0, /г-тый блок будет формально 
влиять на остальную схему вследствие необходимости соблюдения 
неравенства (VI, 29). Следовательно, ответ на вопрос о включении 
к - го блока в схему может быть дан только в результате решения 
двух задач синтеза, в одной из которых й-тый блок заранее учиты- 
вается в задаче, а во второй не учитывается. Поскольку ограничения 
на входные переменные могут существовать в нискольких блоках, 
возникает комбинаторная проблема выбора оптимальной комбина- 
ции из всех возможных вариантов включения или невключения 
в схему блоков, имеющих ограничения на входные переменные. 
Простой перебор может привести к очень большим величинам вре- 
мени счета. 

Случай 3. Возможна ситуация, при которой величины Р <*> 
в критерии (1, 15) имеют постоянные составляющие, не зависящие 
от переменных х (к >, г (к) , и ік) . Такое положение может создаться, 
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если, например, в Р< к '> учитывать затраты на системы автоматиче- 
ского управления, измерительные приборы и т. д. Известно, что 
с одной стороны эти затраты в настоящее время составляют суще- 
ственную часть стоимости основных аппаратов, а с другой, мало 
зависят от конструктивных и технологических параметров этих 
аппаратов. Поэтому можно считать, что в данном случае критерий 
оптимизации имеет вид 

N 

^ = 2 (* (А) , г (,е) ) + Р (А) } (VI, 30) 

к = 1 

где РМ 5» 0 не зависит от х (/і >, г (к \ іР к \ Р <*> (0, 0, 0) = 0. 

Аналогично предыдущему можно показать, что наличие в крите- 
рии частей также приводит к комбинаторной проблеме перебора 
всех возможных вариантов включения или невключения блоков 
в схему 

Случай 4. Пусть в схеме имеются две (или несколько) группы 
потоков, которые должны удовлетворять следующему требованию. 
Внутри одной группы потоки могут смешиваться, потоки же из 
разных групп смешиваться не должны. Такая ситуация может 
возникнуть, например, из требований взрывобезопасности, или 
вследствие того, что потоки находятся в разных фазах. Естественно, 
что решение а* задачи (VI, 27), вообще говоря, не будет удовлетво- 
рять этому требованию, вследствие чего также возникает комби- 
наторная проблема выбора оптимальной комбинации из всех воз- 
можных вариантов подачи в каждый блок потоков только одной 
группы. Возможен и смешанный случай, когда одна задача синтеза 
ХТС будет комбинацией четырех случаев рассмотренных выше. 
Подход, который будет рассмотрен для каждого из четырех случаев 
в отдельности, легко может быть обобщен и на указанный смешанный 
случай. 

Для простоты изложения будем считать, что каждый блок имеет 
один входной и один выходной поток и воспользуемся обозначе- 
ниями (1,5). Излагаемый подход будет комбинацией метода «ветвей 
и границ» и МСП, который будет использоваться для получения 
нижних оценок, поскольку переход от дискретных переменных и 
непрерывным позволяет применять численные методы нелинейного 
программирования. Общая схема метода «ветвей и границ» для всех 
четырех случаев совпадает с описанной выше. Для каждого от- 
дельного случая опишем правило ветвления, правило определения 
нижней оценки и правило окончания процедуры [132 — 134]. 

Синтез ХТС при условии целочисленности структурных 
параметров 

Будем исходить из предположения, что критерий имеет вид (1, 15), 
а фазовые ограничения (I, 11) отсутствуют. Для простоты изложе- 
ния примем, что все структурные параметры а и целочислены и 
имеется только один входной поток, подаваемый только в один 
блок, 
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Правило ветвления. В качестве структурных параметров 2-го 
рода выберем сами структурные параметры а и . Между этими пара- 
метрами будет существовать следующее взаимно однозначное соот- 
ветствие: 

6 к = Щі к = Ш + і (VI, 31) 

Пусть вершине А р . соответствует параметр ветвления 6 Р . Тогда 
множество схем А' р . разбивается на два подмножества, соответству- 
ющие двум потомкам вершины А ! р .\ в схемах одного из них присут- 
ствует поток, соответствующий значению параметра 6 Р = 1, в схе- 
мах другого этот поток отсутствует (6 р = 0). 

Для множества схем А[ характерно следующее: потоки, соответ- 
ствующие параметрам 8 Рі , ..., 8 Р .. [см. выражение (VI, 24) ] при- 
сутствуют во всех схемах, а потоки, соответствующие параметрам 
б ?і , ..., 8 Ч .., отсутствуют. Введем множества 0{ и 0[\ 

О'і == {« : г|) (а) = 0, 0^ 1, а - целое, (VI, 32) 

ОІ = (а: г|)(а) — 0, 1^ (VI, 33) 


где в соответствии с соотношением (VI, 31) в вместо 8,- стоят пара- 
метры с іф Множество 0{ отличается от множества 0[ только тем, 
что условие целочисленности параметров а заменено условием 
непрерывности _и принадлежности интервалу (0, 1). Поскольку Но = 
= 0, то Со и Со определяются выражениями (VI, 4), (VI, 28). 

Определение нижних оценок. Задача определения Р'* может быть 
записана следующим образом 


Р'* = тіп Р (а, и) (VI, 34) 

а, и 

Поскольку О'і сг О'і, в соответствии с выражением (VI, 16) нижняя 
оценка р( может быть получена решением следующей задачи: 

р{ = тіп Р (а, и) а 0 Щ (VI, 35) 

а, и 

В задаче (VI, 35) как и, так и а являются непрерывными пере- 
менными, и для ее решения могут быть использованы методы, изло- 
женные в гл. III, IV. 

Критерий прекращения ветвления. Пусть а и — решение за- 
дачи (VI, 35). Легко видеть, что если — целые, то выполняется 
условие (VI, 22) прекращения поиска. В случае, когда решение а 
задачи (VI, 35) будет нецелым, I схема, используемая в критерии 
(VI, 23), может, например, определяться следующим набором а: 


1 1 при а*. > 0,5 
| 0 при аТу < 0,5 


(VI, 36) 
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Остановимся теперь на вопросе — какой из структурных пара- 1 
метров а и целесообразно принимать в качестве параметра ветвле- ^ 
ния в вершине А\. Наиболее очевидное правило — это выбор в ка- 
честве параметра ветвления такого параметра а и , который был бы ; 
наиболее близок к 0,5, т. е. выбор из условия 

тіп | 0,5 — | 

*. / 

Однако это правило имеет серьезный недостаток. Действительно, ; 
пусть, например, поток из к-то блока близок к нулю, тогда варьиро- 
вание структурных параметров а ѣ , (/ = ТГ/Ѵ) близких к 0,5 будет : 
очень мало влиять на критерий. Отсюда ветвление по этим пара- 
метрам может привести к схемам, оптимальные критерии для кото- 
рых будут отличаться очень незначительно. Это может привести 
к большому числу лишних ветвлений. Поэтому, по-видимому, це- 
лесообразно придерживаться следующего правила: если струк- ■ 
турный параметр соответствует потоку, близкому к нулю, то ветвле- 
ние по нему производить не следует. В процессе поиска иногда 
можно существенно уменьшить число параметров а. Действительно, 
пуст ь в н екоторой вершине А[ оказалось, что все параметры а ік , 

(к = 1 , ІѴ) равны нулю. Это значит, что на і'-тый аппарат не подается і 
ни один поток, и выход этого блока будет нулевым. Отсюда следует, 
что не имеет смысла варьировать параметры а кі , (к = 1, уѴ), свя- 
занные с выходным потоком этого блока, и все эти параметры можно 
приравнять нулю. После этог о над о проверить, не появилось ли 
новых совокупностей а и (/ = 1, Ы), равных нулю, и т. д. 


Синтез ХТС при наличии фазовых ограничений 

Будем исходить из предположения, что структурные параметры а и 
удов летвор яют условию (VI, 26), что в критерии (VI, 30) Р = 0, 

(к = 1, АД и имеются фазовые ограничения (1,11). Структурные 
параметры 2-го рода 6 введем следующим образом: 

^ / 1 ' если г '" ы ^ бжж включается в схему 

1 0, если г-ый блок не включается в схему ^ 

Введем вспомогательный вектор у, компоненты которого равны 

Г 1. ес ли в ('-ом блоке учитываются фазовые ограничения 

- 1 (О, если они не учитываются (VI, 38) 

Перепишем соотношения (I, 1), (I, 11), (I, 15) в виде: 


(VI, 38) 


Г = 2 8кГ (к) (х 1к) , « <А) , г'*>) 


(VI, 39) 


Ф (А) (б, у, х) = 8 к у к у {к) (х ік) ) ^ а (/;) (VI, 40) 

г (к) = 8 к [ (к) (х ( *>, ((<*>) (VI, 41) 

Если положить б й = 0, то из рассмотрения исключается к- тый 
блок, поскольку его вклад в общий критерий и выходные перемен- 


ные будет равен нулю, а фазовое ограничение (VI, 40) будет заведомо 
выполняться. Если положить уі = 0, то в /-ом блоке фазовое огра- 
ничение заведомо выполняется. Если задать значения перемен- 
ных а, 8, и, то рассчитав схему, можно найти соответствующее зна- 
чение критерия Р, отсюда Р есть некоторая сложная функция этих 
переменных Р = р ( ос, б, и). Задача синтеза с учетом фазовых огра- 
ничений может быть представлена следующей дискретно-непрерыв- 
ной экстремальной задачей 


гпіп Р (а, б, и ) 
ос, 6, и 


и^і! а <ЕОд ф (А) (б, 1, (VI, 42) 


Задача синтеза схемы без учета фазовых ограничений выглядит 
следующим образом: 

тіп Р (а, 1, и) сс^О° иРІІ 
а, и 


Правило ветвления. Множество А' р . разбивается на два подмно- 
жества, в схемах одного из которых будет присутствовать некото- 
рый (например, &-тыи блок), а в схемах другого — отсутствовать 
(назовем этот блок блоком ветвления). Это значит, что схемы одного 
множества будут характеризоваться тем, что для них 8 к = 1 , для 
схем же другого множества 8 к — 0. Введем вспомогательный век- 
тор Г{, компоненты которого у (• равны 


( 1, если б 
П = ( 

( 0, если б А ^ОІ 

Задача определения нижней границы р{* 
быть записана следующим образом: 


множества 


(VI, 43) 
А'і может 


Н* 


гпщ 


обод- с/, ф <8, і,*)<о 


Р (ос, б, и) (VI, 44) 


Покажем, что нижняя оценка р( может быть получена решением 
следующей задачи: 

(VI, 45) 

а 6 Со, и (; и 

^( Л {- Г І> (VI, 46) 

Заметим, что в то время, как в задаче (VI, 44) компоненты вектора б 
являются поисковыми (двоичными) переменными, в задаче (VI, 45) — 
это фиксированные числа. Покажем, прежде всего, что множество 
схем, определяемое условиями б = А{, а ^ Со, среди которых 
ищется^ оптимальная схема в задаче (VI, 45) совпадает с множеством 
схем А'і, среди которых ищется оптимальная схема в задаче (VI, 44). 
Действительно, возьмем произвольную схему, принадлежащую А{> 
которая характеризуется набором б 6 В{, а 6 О° 0 . Ясно, что та же 
схема может быть получена и при выполнении условии б = А'і, 
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а ^ Со. Для этого н адо в ыбрать оу = а и , (/ -= 1, /V), если 6* Ф 0 и 
а и = = 0. (/ 434 1, У), если б, = 0. 

Рассмотрим теперь смысл неравенства (VI, 46). Согласно опре- 
делению вектора Г{ условие (VI, 46) означает, что в задаче (VI, 45) 
отсутствуют фазовые ограничения для блоков, которые не являются 
блоками ветвления в оптимальных вершинах пути АІМ и наоборот, 
учитываются все фазовые ограничения, соответствующие блокам, 
которые являются блоками ветвления в оптимальных вершинах 
пути А°оА{. Поскольку задача (VI, 45) отличается от задачи (VI, 44) 
только тем, что в ней отсутствуют некоторые фазовые ограничения, 
то в соответствии с уравнениями (VI, 16) при любых значениях 
двоичных параметров 6 ^ существует соотношение (VI, 12) и 
величина р(- действительно является нижней оценкой. В задаче 
(VI, 45) все поисковые переменные являются непрерывными. В ка- 
честве блока ветвления в множестве А^ надо будет выбирать один 
из блоков, для которого в процессе решения задачи (VI, 45) ограни- 
чения (I, 1 1) оказались нарушенными. 

Условие окончания процедуры поиска. Условие (VI, 22) будет 
выполнено, если при решении задачи (VI, 45) все ограничения 
(I, 1 1) будут выполнены. В качестве /-той схемы в выражении (VI, 23) 
может быть взята схема, которая будет получена в результате ре- 
шения задачи: 

тіп Р (а, А/ , и) «(ЕОо ф (А/, 1, х) ^ а 

В отличие от задачи (VI, 45) здесь учитываются фазовые ограни- 
чения во всех блоках, которые не подвергались ветвлению в верши- 
нах пути А1а{. 

Синтез схем при наличии постоянных составляющих 
критериев 

Будем исходить из предположения, что фазовые ограничения (1,11) 
отсутствуют, а параметры а удовлетворяют условиям (VI, 26). Струк- 
турные параметры 6 введем также, как и в предыдущем случае 
[см. выражение (VI, 37)]. Введем также вспомогательный вектору, 
компоненты которого определяются следующим образом: 

Г 1, если в г-ом блоке учитывается постоянная составляющая критерия 
[ 0, если она не учитывается 

Соотношение (I, 1) опять запишем в виде (VI, 41), а критерий 
(VI, 30) в виде 

Рт- 2 б к[Р {к) (х (к) , и {к) , г<*>) + у к Р {к) ] 

к = 1 

• Если положить 6 Й — 0, то из рассмотрения исключается 6-тый 
блок; если же положить у й ,« 0, то в 6-том блоке не учитывается 
постоянная составляющая критерия. Значение Р есть некоторая 
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сложная функция переменных и, а, б, у : Р = Р (а, б, у, и). Задача 
синтеза в данном случае может быть представлена следующей ди- 
скретно-непрерывной задачей: 

шіп Р(а, б, 1, и) и^и (VI, 47) 

Ь, и,а. 

Правило ветвления будет таким же, как в предыдущем случае. 
Задача определения величины р{ может быть записана следующим 
образом: 

№ тіп Г (а, б, 1, и) а^Оп и^і/ (VI, 48) 

а, б, и 1 

а величина р{- определяется решением задачи 

р{ =* тіп Р (а, ДІ, Г(, и) (VI, 49) 

аССі", 

где Г/, А { определяется соотношениями (VI, 43), (VI, 25). Действи- 
тельно, пусть схема ц, определяемая значениями а*, б*, и*, дает 
оптимальную величину критерия в условиях задачи (VI, 48): Р[* = 
« Р (а* , 6 *, 1, и*). Поскольку множества схем, среди которых 
ищется оптимальная схема, в задачах (VI, 48) и (VI, 49) совпадают 
(доказывается этот факт так же, как и в предыдущем случае), среди 
схем, определяемых условиями задачи (VI, 49), также найдется 
схема < 7 , которая определяется значениями а*, б = Д/. Зна- 
чение критерия для этой схемы в обозначениях задачи (VI, 49) будет 
равно Р( а, Л{, Г{-, и). Величины Р( а, б*, 1, и) и Р (а*, А{, 
Т'і, и) определяют значения критерия для одной и той же схемы, 
в которой управляющие переменные принимают одни и те же зна- 
чения, следовательно всегда будет выполняться условие 

Р(а\ Д/, Г', и*)^Т(а*, 6*. 1, и*) 


поскольку при вычислении обеих величин значения рм в выраже- 
нии (VI, 30) будет совпадать, а при вычислении Р (а* , А{, Г{, и*) 
для некоторых блоков постоянные составляющие Р (і \ (р(*> ^ 0 ) 
не будут учитываться. Таким образом, значение критерия задачи 
(VI, 49) для схемы д будет меньше, чем величина р{*; отсюда, по- 
скольку р'і заведомо не больше величины Р (а* , А[, 1, и) наше 
утверждение доказано. 

Условие окончания поиска. В качестве схемы I, используемой 
в уравнении (VI, 23), может быть взята схема, которая будет полу- 
чена в результате решения задачи 


тіп Р (а., Д/ 1, и) 
а ^ 0 [] , и ^ и 


(VI, 50) 


Задача (VI, 50) отличается от задачи (VI, 49) тем, что в ней учи- 
тываются постоянные составляющие критерия (VI, 30) во всех 
блоках, из которых составлено множество схем Л(. 

8 * 
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Синтез схем при условии несмешиваемости 


групп потоков 


Будем исходить из предполож ения , что критерий оптимизации имеет 
вид (VI, 30); РЮ = 0, (к = 1 , Ы), структурные параметры удовле- 
творяют (VI, 26)^ фазовые^ ограничения (I, 11) отсутствуют. Будем 
называть первой группой выходные потоки блоков с номерами 
1, • ■ •> т, а второй группой — выходные потоки блоков с номе- 
рами т + 1, . . N. Пусть потоки внутри одной группы могут 
смешиваться один с другим, потоки же из разных групп смеши- 
ваться не могут. Введем векторы б и у, с помощью которых пере- 
пишем соотношения связи (I, 6). 

т _ N 

Х и) = б г 2 “іУ Л + (1 — б іУі) 2 ] и іі гіі) (VI, 51) 

/=І /=/л+ 1 

Выполняются соотношения 

т 

2 если б іУі = 1 (VI, 52) 

/=1 

N 

Х (і) = 2 ] “г/ г(/) . если &І = о, Уі = 1 (VI, 53) 

І=т+ 1 

2 ] ацг (1) , если б/ = I, у г = 0 (VI, 54) 

/= 1 

В данном случае критерий (VI, 30) есть функция переменных а, 
б, у, и : Р = Р (а, б, у, и). Поскольку на вход каждого блока должны 
подаваться потоки либо первой, либо второй группы, задача син- 
теза ХТС в данном случае может быть записана в виде (VI, 47). 

Правило ветвления. Множество А ^ разбивается на два под- 
множества; в схемах одного из них на входе некоторого блока (пусть 
это будет к - тый блок) будут смешиваться потоки первой группы, 
а в схемах другого на входе этого блока будут смешиваться потоки 
только второй группы. Для всех схем первого подмножества 6* = 1, 
а для схем другого подмножества бд = 0. Задачи определения 
величин и могут быть записаны соответственно в виде (VI, 48), 
(VI, 49), где компоненты вектора Г( определяются соотношением 
(VI, 43). В соответствии со способом формирования векторов 
Г/ для блоков, которые являлись блоками ветвления в «оптималь- 
ных» вершинах пути А\А{, соотношения связи будут одинаковы 
в задачах (VI, 48), (VI, 49). Для блоков, которые не входят в эту 
группу, соотношения связи в задаче (VI, 48) будут иметь вид либо 
(VI, 52), либо (VI, 53), в то же время, в задаче (VI, 49) эти связи будут 
иметь вид (VI, 54), т. е. в этой задаче они имеют более общий вид. 
Отсюда в соответствии с выражением (VI, 16) всегда будет выпол- 
няться неравенство (VI, 12). 

Условие окончания процедуры поиска. Легко видеть, что если 
при решении задачи (VI, 49) соотношения связи во всех блоках 
примут вид (VI, 52), либо (VI, 53), то будет выполняться условие 
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(VI, 22). В случае, когда условия (VI, 52), (VI, 53) выполняются не 
во всех блоках, схема I, используемая в выражении (VI, 23), будет 
определяться следующим набором б: 


б; 


1, если 2 “/ > Е “*/ 
/=1 І=т + 1 

т N 

О, если XI а іі < И “*/ 
/=1 /="»+! 


где а* — решение задачи (VI, 49). 


Синтез теплообменных систем 


Пусть имеется множество N горячих потоков 5,. = |5 Л1 , . . ., 5 ЛЛГ } 
и множество М холодных потоков $ с = |5 с1 , . . ., 5 сМ ]. Для 
определенности будем считать, что М < N. Теплообменная система 
(ТС) состоит из совокупности рекуперативных теплообменников 
(в дальнейшем будем называть их теплообменниками) и совокупно- 
сти нагревателей (греющий пар) и холодильников (охлаждающая 
вода); первая совокупность есть внутренняя система, вторая — 
внеш няя система. Пусть начальные температуры горячих 8 НІ , 

(і = 1, -V) и холодных 8 С ,, (/ = 1, М) потоков равны, соответ- 
ственно 

Г° ( .(*=ТЛѵ) Т° с; (/ = ТТМ) (VI, 55) 


ТС должна понизить температуры горячих потоков до Тні и повы- 
сить температуры холодных потоков до Тс,-: 

т ні (‘ = МѴ) Т к а (І = Х~М) (VI, 56) 

Внешняя система строится следующим образом. Нагреватели 
(холодильники) ставятся на холодных (горячих) потоках, если 
за счет рекуперации тепла во внутренней системе не удается до- 
стичь желаемых температур (VI, 56). Часто ТС строится таким обра- 
зом, что на каждом потоке блоки внешней системы стоят после 
блоков внутренней системы (рис. 39). 

Температуру охлаждающей воды до и после і- то холодильника 
обозначим соответственно через Т и , ТІУ. Допустим, что начальные 
температуры охлаждающей воды у всех холодильников одинаковы. 

Будем исходить из предположения, что используются трубча- 
тые противоточные теплообменники. Математическая модель тепло- 
обменника, в котором обмениваются теплом горячий 5 Л ; и холодный 
5 С ; потоки, имеет вид [135] 



(Пи- т сі)-(Гні-Т° е ,) . 


! = У А 1, і 


1п КЧі - т 'а)/( т 'ы ~ т сі)] 


(VI, 57) 


(VI, 58) 
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Рис. 39. Схема теплообменной си- 
стем ы . 


где Т'ні, Те/ "—температуры 
горячего и холодного по- 
токов на выходе теплооб- 
менника; у — коэффициент 
теплопередачи; IV, , IV, — 
расходы г- го горячего 
и у -го холодного пото- 
ков; с р і — теплоемкость 
і-го потока; ; — коли- 
чество тепла, передава, 
емого в теплообменнике- 
осуществляющим тепло- 
обмен между і-ым горя- 
чим и /-ым холодным потоками; А и — поверхность теплооб- 
мена. 

Математическая модель холодильника также имеет вид (VI, 57), 
(VI, 58). Математическая модель нагревателя зависит от его типа. 
Если исключить величину (} и из системы (VI, 57), (VI, 58), получим 
систему из двух нелинейных уравнений, связывающую пять пере- 
менных 

Пі Т’м т °а Т’ с1 А ІІІ (VI, 59) 

Задав любые три из них, можно найти остальные, решая систему 
из двух уравнений с двумя неизвестными. 

Остановимся теперь на поисковых переменных ТС: теплообмен- 
нику будет соответствовать одна поисковая переменная (поверх- 
ность теплообмена Л*, ; ), холодильнику две (поверхность тепло- 
обмена А Н і и расход воды і — номер горячего потока, на котором 
стоит холодильник), нагревателю — одна (поверхность теплооб- 
мена А с р /' — номер холодного потока, на котором стоит нагрева- 
тель). В нагревателе расход пара обычно выбирается из условия, 
равенства количества передаваемого тепла теплоте конденсации 
пара. Максимальное число поисковых переменных Ц в ТС будет 
равно 

Я — р + М + 2Ы 

В критерии оптимизации Р будем учитывать капитальные за- 
траты и затраты на охлаждение и нагревание. Обозначим через М р 
совокупность р пар чисел (і, /) (по числу теплообменников в ТС), 
в которой каждая пара (д, г) соответствует теплообменнику, осуще- 
ствляющему теплообмен между </-тым горячим и г-тым холодными 
потоками. Тогда критерий оптимизации может быть записан в виде; 

N М 

г= И р\])+ ЕтГ + (ѵі, 60) 

(«. /)€м р к=\ 
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где Ри.п, РѴ - ТІ* затраты на теплообменник, холодильник и нагре- 
ватель, соответственно е 


Р Сг *= ЬаА і г Рі 2) = ЬаА ь кь + Р<Ѵ = + р,^ (VI, 61) 

б коэффициент окупаемости капитальных вложений; а., 6. _ 
цены единицы массы охлаждающей воды и пара, соответственно; 
а ’ г 7 некоторые корреляционные коэффициенты (обычно 0,6 < 
< Ь < 1); будем исходить из предположения, что цены на воду 
(пар) не зависят от номера холодильника (нагревателя). 

гічч? Да м а оѵі ШТеза Тс ставится следующим образом [117], [126], 
I МЫ— 11371; наити структуру внутренней системы, в случае не- 
обходимости поставить холодильники на горячих потоках и нагре- 
ватели на холодных, определить такие значения всех поисковых 
технологических переменных, при которых температуры горячих 
и холодных потоков до и после ТС принимают значения (VI 55) 
(VI, 56), а критерий (VI, 60) — минимальное значение. Из постановки 
задачи виден ее компромиссный характер по отношению к капи- 
тальным и эксплуатационным затратам. Так, добиться понижения 
температур горячих потоков и повышения температур холодных 
потоков можно, поставив на каждом горячем потоке холодильник 
а на каждом холодном — нагреватель. Этому варианту схемы соот- 
ветствуют максимальные эксплуатационные расходы. Другой ва- 
риант схемы соответствует максимальной рекуперации тепла при 
которой эксплуатационные расходы будут минимальными. Опти- 
мальная же структура ТС будет соответствовать некоторому ком- 
промиссному варианту. 


Синтез систем теплообмена на основе задачи о назначении 

Одной из первых работ по синтезу ТС на основе задачи о назначе- 
ниях была работа [138]. В дальнейшем этот метод был развит в ра- 
ботах ПЗУ!, 1140 Т В дальнейшем произвольную ТС, построенную 
для совокупностей горячих 8 Н и холодных потоков будем обо- 
значать через ТС (5 Л X 5 С ). ТС будем называть базовой если 
она имеет структуру, показанную на рис. 39, и каждый поток во 
внутренней системе может обмениваться теплом только один раз. 
Задачу синтеза базовой ТС ($ Л X 3' ,.) будем называть основной 
задачей синтеза размерности N X М. 

Синтез базовой теплообменной системы. Рассмотрим вначале 
случаи, когда числа холодных и горячих потоков равны N = М 
а число теплообменников также равно N. Покажем, что при сделан- 
ных предположениях задача синтеза ТС может быть сведена к спе- 
циальной задаче целочисленного линейного программирования — 
задаче о назначениях [127, с. 405]. Введем двоичные переменные 
следующим образом: 1 


X 


и — 


1, если есть теплообмен между горячим потоком 5/,; 
и холодным потоком 

0, если нет теплообмена между горячим потоком 8^ 
и холодным ПОТОКОМ З с ] 


(VI, 62) 
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Рис. 40. Схема ЭБС (/, ^) 

Матрица X = ||'л:^|| называется 
матрицей назначения. 
Поскольку в базовой ТС на каж- 
дом горячем и холодном потоке 
может стоять только один тепло- 
обменник, переменные х и должны 
удовлетворять следующим соот- 
ношениям: 

N N 

Е*» =1 < ІѴ - 63 ) 

/= і <=і 

Из выражений (VI, 62), (VI, 63) вытекает, что в каждой строке 
(столбце) матрицы X имеется только один элемент равный единице, 
а все остальные элементы строки (столбца) равны нулю. Поскольку 
стоимость и начальная температура охлаждающей воды (пара) не 
зависит от номера холодильника (нагревателя), отпадает проблема 
перебора при построении внешней системы, и за данным горячим 
(холодным) потоком может быть закреплен любой холодильник 
(нагреватель). Поэтому закрепим за теплообменником, в котором 
обмениваются теплом потоки 8 М , 5 С7 -, один холодильник, который 
будет обеспечивать охлаждение горячего потока 8 М до темпера- 
туры Тм и один нагреватель, который будет обеспечивать нагрева- 
ние холодного потока 8 С / до температуры Т% (рис. 40). В данном 
случае полученная совокупность теплообменника, нагревателя и 
холодильника будет элементарным блоком синтеза, который обозна- 
чим через ЭБС (і, /'). Любая базовая ТС состоит из N таких ЭБС 
(і, /). В связи с этим перепишем критерий (VI, 60), учитывая, что 
р — М = N 

Р= 2 Рі.і 

и,п€.м к 

где Р{,/ = РіУі + Р\ 2) + Р\ 3) — часть критерия (VI, 60), относя- 
щаяся к ЭБС ( і , }). Задача оптимизации ЭБС ( і , /) с критерием Р {> ] 
записывается следующим образом 



при условии 


сі 


шіп Рі ] (VI, 64) 

= Т к сі г;, = 7* (VI, 65) 


Поскольку в базовой ТС на каждом потоке стоит только один 
теплообменник, между элементарными блоками синтеза нет взаим- 
ного влияния. Так что каждый ЭБС можно оптимизировать отдельно; 
при этом будет получен оптимальный режим для всей ТС, т. е. будет 
справедливо равенство 


тіп 


А і, 1' А ср А Ы’ Ѵ і 




тіп 


А і,і- А сг А М' ѵ і 


1 
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при условии выполнения соотношений (VI, 65) для (і, / = 1, іѴ). 
Обозначим через /Д оптимальное значение критерия Р иі , полученное 
решением задачи (VI, 64), (VI, 65). 

(V X Лі) -Матрицу Ф = будем . называть матрицей 

оценок. Введем целевую функцию следующим образом: 

Л' N 

^ (і, =их;7 ичі (ѵі, ее) 

і=і /= і 

В соответствии с условиями (VI, 62), (VI, 63) в Р (Х) в любом случае 
будет присутствовать только N каких-либо величин /Д ( і , / = 1, ІѴ). 
Задача оптимизации базовой ТС может быть теперь записана сле- 
дующим образом: 

N N 

тіп 2 2 Пі*И (VI, 67) 

х іі <=і /=і 
N N 

2 *и = 1 2 *и = 1 ( ѴІ * 68) 

/ = 1 І=І 

Это специальная задача целочисленного линейного программи- 
рования, которая носит название задачи о назначениях. Для нее 
имеются хорошо разработанные методы решения. Решив эту задачу; 
найдем оптимальную структуру базовой ТС. 

Рассмотрим теперь случай, когда числа холодных и горячих 
потоков не равны (V > М), а число теплообменников равно М. 
При этом по-прежнему на каждом холодном потоке обязательно 
будет стоять теплообменник. В то же время, на М горячих потоках 
будет стоять теплообменник, а на остальных N — М. горячих пото- 
ках он будет отсутствовать. Двоичные переменные х і} - в данном слу- 
чае удовлетворяют соотношениям 

М N 

2 (« = 1. V) 2 Х Ч= 1. (/= 1. М) (VI, 68 а) 

і= 1 (=1 

Если на р-том горячем потоке теплообменник отсутствует, то 
охлаждение этого потока будет осуществляться только за счет 
холодильника. Обозначим через минимальные затраты на холо- 
дильник, охлаждающий і-тый горячий поток, в том случае, когда 
отсутствует теплообмен этого потока с холодными потоками. Вве- 
дем величины 

Фі — 2 ^Ч х и ~Ь ( 1 — 2 /г 
/= і \ /= і / 

При этом выполняется соотношение 

если <-тый горячий поток обменивается теплом с /- тым холодным 

[ і , если і-тый горячий поток не обменивается теплом 

ни с одним холодным потоком 

Действительно, если і-тый горячий поток обменивается теплом 
с /-тым холодным потоком, то с учетом ограничений (VI, 68а) Хц = 
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Ь х ір — 0 (р =7^ /)■ Отсюда второе слагаемое в выражении для ф* 
равно нулю и ф; = / 0 -. Если г'-тый горячий поток не обменивается 


теплом с холодными потоками, то х і} = 0, (/ = 1, М) и первое сла- 
гаемое в ф; равно нулю, а второе равно /,-. Таким образом, величина 
представляет собой стоимость охлаждения і - го горячего потока 
при любом способе охлаждения, а величина суммы всех ф г ( і = 
— 1, . . п) при наличии ограничений (VI, 68 а) — стоимость одной 
из возможных ТС. Так что задача синтеза ТС запишется следующим 
образом: 


N 

тіп У] 
Х ІІ ;= 1 



при условии выполнения соотношения (VI, 68). После приведения 
подобных членов в выражении для критерия получим несимметрич- 
ную задачу о назначении. 

Синтез ТС произвольной структуры. Рассмотрим два подхода 
к этой задаче. При первом подходе так же, как и в работах [138]— 
[140] каждый горячий 5 /іг (холодный 5 С ;) поток разбиваем на (/л ; ) 
элементарных потоков таким образом, чтобы выполнялись следу- 
ющие условия: 

а) массовый расход любого элементарного потока равен массо- 
вому расходу исходного горячего (холодного) потока; 

б) начальная температура Т \ іі1+ 1 (I + 1)-го элементарного по- 
тока равна конечной температуре Тм, і I - го элементарного потока 


п'к 'Т'О 

с/, г 1 с), г+1 


= 0 


'гк 'гО 

1 ііі, I 1 ііі, ;фі 


= 0 


/=1, гі. — і ; г — \ , т- — 1 (VI, 69) 

в) начальная температура первого элементарного потока равна 
начальной температуре исходного потока, а конечная температура 
последнего элементарного потока равна конечной температуре 
исходного потока 


7^0 Т'О грЬ грк 

1 М> 1 1 Ні 1 Ні, п. ~~ 1 Ні 


Т'О т»о 

1 С і,\ -■ 1 с і 


'рк грк 

1 С /, ГП] 1 сі 

(VI, 70) 


Так же, как в работах [138] — [140] будем исходить из пред- 
положения, что каждый элементарный горячий (холодный) поток 
может обмениваться теплом только один раз. Однако, в отличие 
от этих работ мы не будем предполагать, что от каждого элементар- 
ного потока отбирается, а каждому холодному элементарному 
потоку добавляется одно и то же количество тепла </. (Способы вы- 
бора величины ц даны в работах [138] — [140]). Прежде всего это 
предположение является довольно ограничительным, поскольку 
ниоткуда не следует, что в каждом теплообменнике оптимальной ТС 
количество обмениваемого тепла должно быть одним и тем же. Кроме 
того, это предположение запрещает теплообмен между потоками, 
между которыми он физически допустим, побудет меньше, чем ^ [141 ]. 
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Дадим всеім горячим элементарным потокам новую (сплошную) 
нумерацию и будем рассматривать их как новую совокупность 
горячих потоков 5 Й . Аналогичным образом, все холодные элементар- 
ные потоки будем рассматривать как новую совокупность холодных 
потоков 5 6 .. Числа N , М потоков в множествах $ к , $ с будут равны 
N Ш я х 4* • • • Пн\ М /л, : т м . Воспользуемся декомпози- 

ционным принципом закрепления и зафиксируем начальные и ко- 
нечные температуры всех элементарных потоков при соблюдении 
условий (VI, 69), (VI, 70). Для новых множеств 5 к , горячих и 
холодных потоков построит оптимальную базовую ТС (5 к X 5 е ); 
для этого мы должны решить основную задачу синтеза размерности 
N X М. Конечно, решение этой задачи не дает точного решения 
первоначальной задачи синтеза ТС, поскольку начальные и конеч- 
ные температуры элементарных потоков были заданы произвольно. 
В связи с этим предлагается следующая двухуровневая процедура. 
На первом уровне решается основная задача синтеза ТС размерно- 
сти N X М при заданных начальных и конечных значениях тем- 
ператур элементарных потоков. На втором уровне проводится опти- 
мизация схемы найденной (фиксированной) структуры, при этом 
в качестве поисковых используются все технологические перемен- 
ные Л А м , А сі , і/ ( . В результате решения этой задачи будут уточ- 
нены значения начальных и конечных температур всех элементар- 
ных потоков. После этого опять решается основная задача синтеза 
ТС при новых значениях начальных и конечных температур эле- 
ментарных потоков, и т. д. 

Подытожим — какие основные операции приходится проводить 
на каждой итерации при использовании этого метода. Для простоты 
будем считать, что N = М и что каждый исходный поток разбит 
на я элементарных потоков, т. е. N = яѴ. На нижнем уровне не- 
обходимо будет произвести следующие операции: 

1) для формирования матрицы Ф решить А 2 '®*я 2 А 2 задач опти- 
мизации ЭБС (і, /), каждая из которых сводится к оптимизации 
критерия Р и1 по четырем переменным А іг] , А м , А с }, 

2) решить задачу о назначениях с (пЫ X яІѴ)-матрицей. 

На верхнем уровне необходимо будет решить задачу оптимиза- 
ции ТС с фиксированной структурой и числом теплообменников, 
равным яѴ. При этом число поисковых переменных будет равно 
4яѴ (ЗпЫ — поверхности теплообменников, нагревателей и холо- 
дильников, яѴ — расходы воды). 

Решение задачи определения элемента матрицы оценок Ф 
может быть существенно упрощено, если поверхности теплообмена 
в теплообменнике и холодильнике выбирать из условия максималь- 
ного сближения температур. Для теплообменника это условие имеет 
вид 

ТІі~Т' сі .0АТ тіп (VI, 71) 

где ДГ т1п заданная величина. Аналогичное условие может быть 
выписано для холодильника. Таким образом, к двум условиям 
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Рис. 41. Представление тепло- 
обменной системы в виде т- 
стадийной схемы. 



(VI, 65) в ЭБС ( і , /) в данном случае добавляются еще два условия, 
и для определения /Д необходимо будет решить систему из четырех 
уравнений с четырьмя неизвестными А и} , А сі , А ні , и ;. Легко пока- 
зать, что решение указанной системы сведется к последовательному 
расчету теплообменника, холодильника и нагревателя. Ясно, что 
при этом мы не получим оптимального значения величины Р. 

Рассмотрим теперь второй подход. Представим вначале ТС 
в виде т-стадийной схемы (рис. 41), каждая стадия которой пред- 
ставляет собой базовую ТС (8 к X 8 С ). Горячие и холодные потоки 
последовательно проходят все стадии с 1-й по т-ю. Ясно, что полу- 
ченная ТС будет глобальной, из которой может быть получена лю- 
бая ТС. Положив нулю значения поверхности теплообмена у всех 
теплообменников кроме одного на каждой стадии, придем к много- 
стадийной схеме, рассмотренной в работе [142]. 

Рассмотрим подход к синтезу ТС, использующий построенную 
глобальную ТС. Он также основывается на декомпозиционном 
принципе закрепления, сводящим задачу синтеза ТС к двухуровневой 
оптимизационной процедуре. В соответствии с принципом закрепле- 
ния закрепим в т-стадийной схеме температуры всех горячих и 
холодных промежуточных потоков. Рассмотрим к - ую стадию (к < т). 
На этой стадии имеется совокупность 5 Л горячих и 5 С холодных 
потоков, с известными входными и выходными температурами. 
Определим наилучшую ТС для к - той стадии. Поскольку к - тая ста- 
дия представляет собой базовую ТС ($ Л X 8 С ), задача синтеза ТС 
к - той стадии сводится к основной задаче синтеза размерности N X М. 
Решив эту задачу для всех стадий глобальной схемы, найдем неко- 
торую структуру ТС, что будет являться окончанием процедуры 
1-го уровня. На втором уровне температуры всех промежуточных 
потоков освобождаются от закрепления и проводится оптимизация 
всей ТС, при этом поисковыми переменными являются все техно- 
логические параметры. Поскольку все переменные здесь непрерыв- 
ные, на этом уровне используется один из поисковых методов. После 
окончания оптимизации будут получены новые значения темпера- 
тур для промежуточных потоков. Закрепим их на этих значениях 
и опять перейдем к решению задач 1-го уровня. Преимущество 
этого подхода к построению ТС перед предыдущим состоит в том, 
что решение одной задачи о назначениях большой размерности на 
1-м уровне заменяется решением т задач о назначениях меньшей 
размерности. Однако, этот подход нельзя применять для синтеза 
циклических ТС. 

Некоторые обобщения. I. Первый и второй подходы легко рас- 
пространить на случай, когда необходимо синтезировать тепло- 
обменную систему с разветвлением потоков. Для примера рассмо- 
трим первый подход. Пусть описаным способом введены элементар- 
ные потоки. Назовем их элементарными потоками 1-го рода. Рассмо- 
трим /-тый элементарный поток, полученный из горячего потока 8 НІ . 

220 






Рис. 4 2. Схема разбиения элементарного по- 
тока 1-го рода на совокупность элементарных 
потоков 2-го рода: 

а — исходный технологический поток; б — сово-- 
купноеть элементарных потоков 2-го рода, по- 
лученных из /-го элементарного потока 1-го рода. 

Его расход равен IV,. -С помощью 
делителя потоков (рис. 42) ра- 
зобъем этот элементарный поток І-го 
рода на т и элементарных по- 



токов 2-го рода. Полученную совокупность обозначим через 5«. 
Каждый д-тый элементарный поток 2-го рода будет характеризо- 
ваться расходом сс^й 7 ( при 



д=1 



Начальная же и конечная температуры будут совпадать с на- 
чальной и конечной температурами элементарного потока 1-го рода, 
т. е. будут равны Т°нс, і и Тні, /, соответственно. 

Проделаем такую же операцию со всеми элементарными потоками, 
при этом опять будет исходить из того, что горячий элементарный 
поток 2-го рода может обмениваться теплом только один раз с любым 
холодным элементарным потоком 2-го рода, и наоборот. После 
теплообмена все элементарные потоки 2-го рода, принадлежащие 
одной и той же совокупности 8ы (или 8І' п ) объединяются в смеси- 
теле. Объединим все горячие элементарные потоки 2-го рода в новую 
совокупность горячих потоков 5 Л , а холодные — в новую совокуп- 
ность 8 С . После этого опять можно воспользоваться двухуровневой 
процедурой первого подхода. Отличие будет состоять только в том, 
что в качестве поисковых переменных помимо начальных и конеч- 
ных температур элементарных потоков будут использоваться также 
структурные параметры а 1 /. При этом размерность задач оптимиза- 
ции как первого, так и второго уровня может существенно возрасти. 

II. Обычно стоимость транспортировки потоков между тепло- 
обменниками мала по сравнению с затратами на охлаждение и нагре- 
вание. Однако для вязких или коррозионноактивных веществ стои- 
мость транспортировки может стать сравнимой с остальными ком- 
понентами критерия (VI, 61) [143]. В этом случае при постановке 
задачи синтеза ТС необходимо учитывать не только структуру, но 
и расположение теплообменников. В этом случае при определении 
элементов /,/ матрицы Ф необходимо учитывать также стоимость 
труб, связывающих теплообменник с источниками холодного и 
горячего потоков, а также стоимость перекачивания потоков. 

III. Задача синтеза ТС решалась в идеализированной постановке. 
Так, коэффициент теплопередачи у может быть рассчитан, если 
известны некоторые параметры, которые не участвовали в описан- 
ной процедуре (например, диаметр трубок и др.). Поэтому после 
того, как описанная процедура синтеза ТС будет проведена, необ- 
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ходимо уточнить коэффициенты теплопередачи, а затем заново 
провести описанную выше процедуру синтеза и т. д. 

Некоторые параметры такие как диаметр, длина и число трубок, 
могут принимать только дискретные значения. Поэтому, после 
того, как найдено значение поверхности теплообмена для данного 
теплообменника, необходимо подобрать эти величины так, чтобы 
максимально приблизиться к этому значению. Другими словами, 
в этом случае дискретная экстремальная задача сначала заменяется 
непрерывной, а решение непрерывной задачи приближается дискрет- 
ным решением. Можно однако пойти другим путем: формируя эле- 
менты матрицы Ф, в качестве поисковых переменных использовать 
не поверхности теплообмена, а диаметр, длину и число трубок. 

Метод структурных параметров 

Для применения описанной выше стандартной процедуры метода 
структурных параметров на все выходные потоки теплообменников 
следует поставить делители потоков, а на входные потоки — сме- 
сители потоков. Кроме того, делители потоков должны быть постав- 
лены на все входные холодные и горячие потоки. Естественно, что 
в смесителе, стоящем на входном горячем потоке теплообменника, 
должны смешиваться только горячие потоки, а в смесителе, стоящем 
на входном холодном потоке, — только холодные потоки. Пусть 
число теплообменников равно т тогда число структурных параметров 
для случая, когда рассматриваются только системы без обратных 
связей, будет равно т (т — 1) + ( М ф Ы) т. Однако стандартная 
процедура метода структурных параметров имеет существенный 
недостаток. Дело в том, что фактически не разрешается смешивать 
потоки. Это условие будет выполнено, если наложить требование, 
чтобы все структурные параметры были целыми числами. Это требо- 
вание, как мы видели, приводит к необходимости проведения трудо- 
емкой процедуры метода «ветвей и границ» совместно с методом 
структурных параметров. 

Опишем другой подход к построению глобальной схемы, в кото- 
рой заранее гарантируется несмешиваемость исходных потоков. 
Будем исходить из предположения, что ТС имеет структуру, пока- 
занную на рис. 39. Представим внутреннюю систему в виде т-ста- 
дийной схемы (см. рис. 41). При этом й-тую стадию ( т < к) построим 
следующим образом. Поставим на каждом горячем и холодном 
входном потоке к-топ стадии делитель потока. Тот из них, который 
стоит на горячем потоке 8^ будет делить поток на М частей (по 
числу холодных потоков); эти потоки будет называть элементарными. 
Каждый делитель, стоящий на холодном потоке будет делить 
его на N элементарных потоков (по числу горячих потоков). Общее 
число горячих (холодных) потоков будет равно УѴЛ4. Построим ТС, 
которая будет обладать следующими свойствами: 

1) каждый элементарный поток может обмениваться теплом 
только один раз; 2) при рассмотрении двух совокупностей элемен- 
тарных потоков, соответствующих исходному горячему потоку 
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Рис. 43. Отдельная стадия глобальной 
схемы теплообменной системы для трех 
горячих и трех холодных потоков: 

1 — 9 — номера горячих элементарных 
потоков; 10 — 18 — то же, холодных. 


и холодному потоку 5 С ;, теп- 
лообмен может проводиться 
только между одной парой 
горячих и холодных элемен- 
тарных потоков из этих сово- 
купностей. 

На данной стадии будет ЛШ 
теплообменников и после про- 
хождения системы теплообмен- 
ников все элементарные потоки, 
соответствующие исходному го- 
рячему (холодному) потоку, 
подаются в смеситель. Такой 
принцип построения глобаль- 
ной схемы обеспечивает с одной 
стороны возможность теплообмена на данной стадии между 
любыми исходными горячим и холодным потоками, а с дру- 
гой — их несмешиваемость. На рис. 43 приведена одна из стадий 
глобальной схемы для случая, когда имеется 3 горячих и 3 холодных 
исходных потока. Последняя (т + 1)-я стадия соответствует внеш- 
ней системе (см. рис. 39). Легко видеть, что данной стадии соответ- 
ствует 2ЫМ структурных параметров. А всего в (т + 1)-стадийной 
глобальной схеме будет 2 тЫ М структурных параметров. Число 
технологических поисковых переменных будет равно тЫМ + 2УѴ + 
‘і ' М; таким образом общее число М поисковых переменных будет 
равно 

Я = 3 т/ѴМ + 2(Ѵ -р М (VI, 72) 

Как обычно, структурные параметры являются непрерывными 
переменными, удовлетворяющими соотношениям (I, 7), (VI, 26). Да- 
вая структурным параметрам определенные значения, можно из 
глобальной получить любую заданную ТС (без рециклов), а после 
проведения оптимизации глобальной схемы, получить схему ТС, 
наилучшую из всех возможных. Поскольку в глобальной схеме 
все поисковые переменные (структурные и технологические) не- 
прерывны, для ее оптимизации могут быть использованы численные 
методы нелинейного программирования. После решения задачи 
оптимизации глобальной схемы ТС будут получены какие-то зна- 
чения структурных параметров (вообще говоря, нецелые). Однако, 
если условия задачи разрешают разветвления потоков, это не 
страшно: если структурные параметры, соответствующие какому- 
либо потоку, окажутся нецелыми, на нем надо ставить делитель 
потоков. Если же разветвление потоков не разрешается, необходимо 
потребовать целочисленность структурных параметров. В этом 
случае, также как и при использовании обычной глобальной схемы, 
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придется применять процедуру метода «ветвей и границ» совместно 
с методом структурных параметров. К сожалению, этот способ по- 
строения глобальной схемы, так же, как и обычный, имеет серьезный 
недостаток, обусловленный с многоэкстремальностью критерия [144] 
и большой размерностью задачи. Все это делает затруднительным 
использованного данного подхода. 

Сроним теперь 1-й и 2-й подходы с методом структурных пара- 
Буд ^ считать > что N = м и что число стадий т в глобаль- 
ной схеме ІС, используемой в методе структурных параметров и 
во 2-м подходе, равно числу п элементарных потоков, на которые 
разбивают исходные потоки в 1-м подходе. Тогда при использовании 
метода структурных параметров задача синтеза ТС сведется к за- 

— Ч ч ш' 7 л Ш 'эл) Н0 ™ п Р ог Р амми Р°вания с числом переменных Я = 
п ~г оЫ . При использовании 1-го подхода на каждой итера- 
ции потребуется решить п 2 Ы 2 задач оптимизации размерности 4 и 
одну задачу оптимизации размерности АпЫ. При использовании 
/-го подхода на каждой итерации придется решить пЫ 2 задач опти- 
мизации размерности 4 и одну задачу размерности АпЫ. Так, если 
п о, N — М — 5, то размерность Ы задачи нелинейного программи- 
рования при использовании метода структурных параметров будет 
равна оЬЮ. При использовании 1-го подхода на каждой итерации 
придется решить 275 экстремальных задач размерности 4 и одну 
задачу размерности 60. При использовании 2-го подхода на каждой 
итерации придется решить 75 экстремальных задач размерности 4 
и одну задачу размерности 60. 

Однако преимущество 1-го и 2-го подходов состоит не только 
в уменьшении размерности экстремальных задач, но и связано с про- 
блемой многоэкстремальности. Метод структурных параметров при- 
водит обычно к многоэкстремальной задаче [122], что связано, по- 
видимому, с тем, что в глобальную схему включены все возможные 
варианты схем ТС. Выбор той или иной структуры определяется 
решением задачи нелинейного программирования. В то же время 
при 1-м и 2-м подходах основная тяжесть выбора структуры ложится 
на решение задачи о назначениях, а с помощью метода нелинейного 
программирования приходится решать задачу оптимизации ТС, 
фиксированной структуры. Конечно, полностью избавиться от много- 
экстремэльности не удается, поскольку даже задача оптимиза- 
ции 1 С фиксированной структуры часто оказывается многоэкстре- 
мальнои. 


Синтез теплообменной системы как части 
химико-технологической схемы произвольной 
структуры 

При выводе рассмотренных выше методов синтеза ТС существенно 
использовались следующие предположения. 

1. Расходы на перекачку потоков через ТС не учитывались. 

2. Значения начальных и конечных температур холодных и 
горячих потоков (VI, 55), (VI, 56) считаются заданными. 
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Избавиться от этих упрощающих предположений можно, рас- 
смотрев совместную работу теплообменной системы с остальной 
частью схемы. В связи с этим рассмотрим некоторую схему 5 (рис. 44), 
состоящую из теплообменной системы 5 и произвольной части 
в которой имеется какое-то число компрессоров. Подсистемы 5, и 
5 2 связаны холодными (1—2), (3 — 4) и горячими (5—6), (7—8) по- 
токами. Обозначим температуры горячих и холодных потоков на 
входе и выходе ТС так, как это сделано в формулах (VI, 55), (VI 56) 
а соответствующие давления через ’ ’ 

РІІ> Р°а и Рнр Рсі = О; / = Г7Ж) (VI, 73) 

Расходы горячих и холодных потоков обозначим через 

Т/гі, V с і (»'=1, V; у = 1 , М) (VI, 74) 

Пусть задача состоит в определении оптимального режима 
схемы 5 с одновременным синтезом ТС 5 2 . Рассмотрим вначале 
I вспомогательную задачу синтеза ТС, в которой будут заданы не 
Г только температуры (VI, 55), (VI, 56), но и давления (VI, 73) на входе 
I и выходе. Для простоты будет считать, что в ТС является базовой. 

, В данном случае в качестве поисковых переменных при решении 
| задачи оптимизации ЭБС (і, /) необходимо использовать длину I, 
і диаметр 3 и число трубок п. Буквы т, н, х в нижнем индексе этих 
* переменных будут означать, что данная величина относится к тепло- 
обменнику, нагревателю или холодильнику соответственно. Обо- 
значим через А Рг.п, Ар т х ^, Др х , А р н — перепады давлений по 
г-му горячему и /-му холодному потоку в теплообменнике, холодиль- 
нике и нагревателе соответственно. Ясно, что эти величины являются 
функциями соответствующих величин /, й и п. При решении задачи 
оптимизации ЭБС (і, /) в данном случае появятся следующие допол- 
нительные ограничения: 

Д Рт . г . , (/ т , а т , п т ) 4. Ар х ( / х , а х , п х ) = р\. _ р\. 

А Рт. х. і ( / т - п т) + (/„, а и , п н ) = р° с . — р к с . 

Вся остальная процедура синтеза ТС аналогична описанной выше. 
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Оптимизация системы 3 
(структура подсистемы З г 
зафиксирована) 


’с]> чу 


Структура 
подсистемы 5% 


Синтез подсистемы З г 



Рис. 45. Схема процедуры синтеза тепло- 
обменной системы как части ХТС произволь- 
ной структуры. 

Перейдем теперь к основной 
задаче. Воспользуемся принципом 
закрепления (см. с. 170) и закре- 
пим температуры (VI, 55), (VI, 56), 
давления (VI, 73) и расходы (VI, 74). 
Благодаря тому, что взаимное 
влияние подсистем 5 2 будет 


ликвидировано, оптимизацию под- 
системы и синтез подсистемы 3 2 (первый уровень процедуры) 
можно провести отдельно. В результате получим какое-то значение 
критерия оптимизации Р для всех схемы, которое будет функцией 
переменных (VI, 55), (VI, 56), (VI, 73), (VI, 74): 


р = р і т ы’ т °а - Т Ъ’ т 1п Рк,< Реп рЪ> Реп ѵ >ч< ѵ сі) (ѵі. 76, 


Процедуре 2-го уровня будет соответствовать задача оптимизации 
функции непрерывных переменных (VI, 76). Этот подход имеет один 
недостаток. Поскольку при синтезе подсистемы приходится решать 
комбинаторную задачу, относительно гладкости функции (VI, 76) 
ничего сказать нельзя. Во всяком случае, трудно предполагать суще- 
ствование во всей области определения не только вторых, но и пер- 
вых производных данной функции. Это будет препятствовать при- 
менению наиболее эффективных поисковых методов — квазинь- 
ютоновских; т. е. для оптимизации функции (VI, 76) можно будет 
применять только методы нулевого порядка. 

Рассмотрим теперь другой подход. Он также будет двухуровне- 
вым и основывается на принципе закрепления. Пусть опять закреп- 
лены переменные (VI, 55), (VI, 56), (VI, 73), (VI, 74). Проведем синтез 
подсистемы 5 2 (первый уровень). На второй уровень вынесем за- 
дачу оптимизации всей системы 5. При этом в подсистеме 5 2 будут 
оптимизироваться только технологические параметры — длины, 
диаметры и число трубок, расходы пара в нагревателе и охлажда- 
ющей воды в холодильнике, а в подсистеме — все варьируемые 
параметры. После решения этой задачи получим новые значения 
переменных (VI, 55), (VI, 56), (VI, 73), (VI, 74) на входе и выходе ТС 
(подсистемы 3 2 ) и можно опять переходить к первому уровню — 
решению задачи синтеза ТС, и т. д. (рис. 45). Преимущество этого 
подхода перед предыдущим состоит в том, что критерий оптимизации 
в данном случае является достаточно гладкой функцией, для мини- 
мизации которой можно использовать квазиньютоновские методы 
1-го порядка. Легко видеть, что описанная двухуровневая про- 
цедура применима с небольшими изменениями и в случае, когда 
3 2 — произвольная подсистема. 

Общий подход, развитый выше, проиллюстрируем на примере, 
когда 5! является системой ректификационных колонн, а 3 2 — 
теплообменной системой. В каждой ректификационной колонне 
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поток, отходящий из верхней части должен быть охлажден в кон- 
денсаторе-холодильнике (будем далее называть его холодильником), 
а к возвращаемой части потока, отбираемого из низа, должно быть 
подведено тепло; обеспечивающее испарение, для чего предусмотрен 
нагреватель (кипятильник). С точки зрения задачи синтеза ТС по- 
ток из верха колонны будет «горячим», а возвращаемая часть потока 
из низа колонны «холодным». В схемах разделения часто исполь- 
зуются только внешние источники энергии (каждый горячий поток 
охлаждается своим холодильником, а каждый «холодный» нагре- 
вается своим нагревателем), такие ТС не содержат рекуперативных 
теплообменников. В то же время тепло «горячих» потоков может 
быть использовано для испарения «холодных» потоков. На 
рис. 46 приведена схема разделения пятикомпонентной сме- 
си АВСОЕ, в которой горячий поток, отбираемый из верха колон- 
ны 3, используется в рекуперативном теплообменнике для 
подвода тепла к возвращаемой части потока, отбираемого из 
низа колонны 4. В схеме используются внутренние источники 
энергии. 

Пусть структура схемы разделения задана и задача состоит 
в выборе структуры ТС и одновременной оптимизации всей схемы 
в целом. Описанная выше процедура полностью применима и в этой 
задаче. Включим в совокупность 8 к горячих потоков все потоки из 
верхних частей колонн, а возвращаемые части потоков, отобранные 
из их нижней частей, — в совокупность 8 С холодных потоков. Если 
между какими-либо холодным и горячим потоками теплообмен 
невозможен, это можно учесть при решении задачи синтеза ТС 
Закрепим переменные (VI, 55), (VI, 56), (VI, 73), (VI, 74) на входе и 
выходе ТС и проведем синтез ТС, используя один из описанных ме- 
тодов с учетом ограничений (VI, 75). После того как структура ТС 
будет найдена, проведем оптимизацию всей схемы, используя в ка- 
честве управляющих переменных ректификационных колонн флег- 
мовые числа, числа тарелок и т. д., а теплообменных систем — числа 
диаметры и длины тру- 
бок. В результате полу- 
чим новые значения всех 
или некоторых перемен- 
ных (VI, 55), (VI, 56), 

(VI, 73), (VI, 74). Закрепим 
их и вновь проведем 
решение задачи синтеза ТС 
и т. д. Синтез систем рек- 
тификации с рекуперацией 
тепла см. в Приложении 3. 


Рис. 46. Схема разделения смеси 
АВСОЕ, в которой используются 
внутренние источники энергии: 

1—4 — ректификационные колон- 
ны; 5 — холодильник; 6 — на- 
греватель; 7 — рекуперативный 
теплообменник . 
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Синтез многослойного адиабатического реактора 

Пусть имеется многослойный каталитический реактор (рис. 47), 
в который поступает исходный поток (температура Т°, расход 0°). 
Будем считать, что в слоях идет экзотермическая реакция. Обычно 
исходный поток используется для охлаждения промежуточных по- 
токов между слоями. Пусть для охлаждения используется только 
процесс теплообмена (без смешения). Известная задача [145] со- 
стоит в определении таких времен контакта т* ( і = 1, Ы) и темпера- 
тур входных потоков в слои, чтобы некоторый критерий Р (будем 
считать, что это затраты) принял минимальное значение. Эту задачу 
интересно решить совместно с задачей выбора структуры ТС, обес- 
печивающей необходимый температурный режим в слоях. 

Воспользуемся общей схемой, изложенной в предыдущем разделе. 
В данном случае, в качестве подсистемы 5, выступают N слоев ка- 
тализатора, а в качестве 5 а — теплообменная система. Рассмотрим 
вначале случай, когда стоимость ТС мала по сравнению со стоимо- 
стью слоев катализатора. В этом случае вначале может быть решена 
задача оптимизации многослойного реактора без ТС, причем пред- 
полагается, что входные температуры Т вх потоков в слои являются 
независимыми поисковыми переменными, а выходные ТІ‘ Ь 1 Х — сво- 
бодными. После решения задачи оптимизации для каждого слоя 
будут известны входные и выходные температуры потоков. Поскольку 
реакция экзотермическая, ТІ ы Х > Т вх . Таким образом, температуру 
потока между і-тым и (і + 1)-м слоем необходимо понизить от вели- 



Рис. 47. Схема адиабатиче- 
ского реактора: 

/ — Л / _ слои катализатора. 



Рис. 48. Глобальная схема многополочного адиабатического реактора: 

1 — N — слои катализатора; N -}- 1 — делитель потока; N 2 — теплообменная система; 
N + 3 — смеситель; А — исходный поток. 
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чины ТІых до величины . Пользуясь терминологией задачи 
синтеза ТС, можем сказать, что имеется один исходный холодный 
поток и N горячих (выходных потоков из слоев), причем N — 1 
горячих потоков (соответствующих промежуточным потокам между 
слоями) необходимо охладить от температуры Гвы Х , • • •, ТІ ыГ° до 
температур 7І 2 *, ■ ■ ТІ^ соответственно. Глобальная схема син- 
теза многополочного реактора совместно с ТС [146] приведена на 
рис. 48. 

Чтобы увеличить возможности ТС, исходный поток А делится 
на М потоков в делителе, см. блок (IV + 1). Пройдя через ТС, эти 
потоки смешиваются в смесителе (Ы + 3), откуда поток подается 
в 1-й слой. Используя одну из процедур синтеза ТС, можно найти 
ее структуру. Рассмотрим теперь случаи, когда стоимость ТС срав- 
нима со стоимостью слоев катализатора. В этом случае на первом 
уровне процедуры синтеза необходимо будет найти оптимальную 
структуру ТС при фиксированных значениях входных и выходных 
температур слоев. На верхнем же уровне необходимо будет совме- 
стно оптимизировать систему слоев и ТС. При этом поисковыми 
переменными будут длины слоев катализатора, поверхности тепло- 
обмена и структурные параметры, соответствующие делителю (IV + 
+ 1). Поскольку в этом случае все переменные непрерывны, для 
оптимизации системы могут быть использованы поисковые методы 
(см. гл. III, IV). 
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ПРИЛОЖЕНИЕ 1. МНОГОКРИТЕРИАЛЬНАЯ ОПТИМИЗАЦИЯ 

Предмет так называемой многокритериальной оптимизации составляют задачи 
типа 

/, фі> ф 2 >---> ->-гшп 

В этом случае поставленная цель характеризуется не одной функцией /, а несколь- 
кими /, ф 1( ф 2 ,..., и задача оптимизации заключается в поиске условного (или 
безусловного) минимума всех критериев. Отметим, что критерии /, ф 1; ф 2 ,..., вообще 
говоря, противоречивы в том смысле, что точки в пространстве варьируемых пере- 
менных, представляющие собой решения задач оптимизации по каждому из заданных 
критериев, в общем случае различны и, следовательно, ни одна из них не может 
служить решением исходной многокритериальной задачи. 

Рассмотрим пространство Е<п значений критериев (т — число рассматриваемых 
критериев). Каждой точке х ^ П С Ек пространства варьируемых переменных 
соответствует точка [/(х), ф х ( х ), ф 2 (х),...] ^ Е т . Образом множества П при этом 
отображении Е п в Е т является область Л достижимых значений векторного крите- 
рия (/, ф х , ф 2 ,...) (см. рис. 14). Внутренние точки Л не могут содержать решения за- 
дачи, так как в этом случае в окрестности рассматриваемой точки г (х) всегда най- 
дется точка из Л с меньшим значением критериев (в заштрихованной части мно- 
жества Л) . 

Назовем точку х € П неулучшаемой, если ни при каком х ^ П не выполняются 
неравенства 

/(х)</(х) Фі^Кф^*) ф 2 (х)< ф 2 (х), ... 

причем по крайней мере одно из них должно быть строгим. Ясно, что образом мно- 
жества неулучшаемых точек является часть границы Л (на рис. 14 обозначена жир- 
ной линией АВ), ближайшая к так называемой, утопической точке С ~ (фшш. /тіп)- 
Множество неулучшаемых точек (так называемое множество Парето) и следует фор- 
мально считать решением исходной многокритериальной задачи. Для получения 
единственного решения данной задачи необходима дополнительная информация, 
позволяющая произвести свертку исходных критериев в один, так называемый «гло- 
бальный» критерий (т. е. сформировать скалярную функцию, зависящую от исход- 
ных критериев), и свести тем самым исходную задачу к традиционной однокритери- 
альной задаче. Таким образом, решение многокритериальной задачи содержит два 
этапа: построение множества Парето и выбор «предпочтительного» решения, явля- 
ющегося элементом этого множества, на основе некоторого «глобального» критерия, 

Одним из способов построения множества Парето является, так называемый 
«параметрический» метод [165], в котором осуществляется свертка критериев во 
взвешенную сумму 

т — 1 т — 1 

РЦ. фі. 2 Міфі + С0 3 / 2 0); = 1 Ш;>0 

1=1 1=0 

с последующим нахождением ее минимума на О. Элементы множества Парето могут 
быть найдены при изменении (О/. Все элементы такого множества могут быть найдены 
этим способом лишь для выпуклого Л. При наличии «зазоров» между границей Л и 
опорными к Л плоскостями (невыпуклый случай) могут быть определены лишь эле- 
менты некоторого подмножества множества Парето (на рис. 14 элементы множества 
Парето, которым соответствуют точки дуги АВ, расположенные между точками / и 2, 
не могут быть найдены параметрическим методом). В связи с этим выбор взвешенной 
суммы в качестве «глобального» критерия для невыпуклых задач является пробле- 
матичным, так как при выборе «предпочтительного» решения элементы множества 
Парето, образы которых расположены в «зазоре» Л, не рассматриваются. 

Более универсальными методами построения множества Парето, пригодными 
и в отсутствие выпуклости Л, являются методы последовательной безусловной мини- 
мизации («уровней», штрафных функций, модифицированной функции Лагранжа), 
которые применяются к решению задачи минимизации одного из критериев, на- 
пример (, с ограничениями, определяемыми функциями <р; всех прочих критериев. 

235 


Составная функция конкретного метода последовательной безусловной минимизации, 
очевидно, представляет собой некоторую свертку исходных критериев, зависящую 
от параметров. Из геометрических соображений, приведенных в гл. IV при изложе- 
нии методов последовательной безусловной минимизации, следует, что минимум 
функции свертки при фиксированных значениях параметров определяет элемент 
множества Парето, поскольку изоповерхность функции свертки, рассматриваемая 
в пространстве критериев и отвечающая минимальному ее значению, касается гра- 
ницы Л. Таким образом, для задачи минимизации / при ограничениях ф; = 0 эле- 
ментом множества Парето является не только х* — решение задачи, но и точки х, 
определяемые в процессе решения и соответствующие минимуму составной функции 
(свертки) при фиксированных значениях ее параметров. Для получения достаточно 
полного представления о множестве Парето необходимо, как и при использовании 
параметрического метода, выполнить неоднократное решение задачи: шіп / при ф; = 
= а ( для различных сц, аг ш1п < а г < <Ч тяу , (на рис. 14, Фл'< а ^ ф В ). 

На втором этапе решения многокритериальной задачи (выбор «наилучшей» 
точки из множества Парето) наиболее целесообразно воспользоваться ее близостью 
к утопической точке С в смысле некоторой меры, например, квадратичной метрики 

Р (/. Ф) = (/ — /тіп) 2 + (ф — фтіп ) 2 ИЛИ Г (Л ф) «= шах {|/ — / т1п |, | ф — фтт|) 
определяющей необходимую свертку, т. е. «глобальный» критерий. В первом случае 
решению соответствует точка Р касания с множеством Л сферы с центром в С и наи- 
меньшим радиусом, во втором — точка С} А, имеющая минимальное значение 
наибольшего из отклонений от утопической точки. 


ПРИЛОЖЕНИЕ 2. КУБИЧЕСКАЯ ИНТЕРПОЛЯЦИЯ 


Пусть на отрезке [0,1] задан полином / (х) третьей степени / (х) = ах 3 -)- Ьх 2 
+ сх + а и § (х) — - его градиент: д (х) = 3 ах 2 + 2 Ьх + с. Определим положение 
минимума а € 10, 1 ] функции ( (х) при заданных значениях / и п на концах отрезка: 
Л = /(0); Во = 8 ( 0 ); /г-/(1); й = 2(1). 

В точке минимума х — а должно быть § (а) = 0, §' (а) > 0. Отсюда 


— 6+ V Ъ 2 — 3 ас 
За 


(, Ь 2 — 3ас)>0 


Условия на концах отрезка дают: 

/о = ёо = И /, = а + 6 + с + д х = За + 26 + с 

Обычно в алгоритмах минимизации добиваются д а < 0, т. е. с < 0, что мы и будем 
предполагать. Последние два условия (с учетом двух первых) можно рассматривать 
как систему линейных уравнений относительно а и 6. Находим 

а = 2 (/о — /,) + Ві + ёо 

Для вычисления а воспользуемся тождеством: 6* — Зас = ( — 6 — с) г — с (За + 
т 26 -р с). Из приведенных выше условий на концах отрезка, используя найденное а, 
получа ем: (-6 - с) = й - Д + а - 3 (/„ - Л) + ёі + ёо- Положим г = -6 - с, 
ИІ_ у Ь г — Зас. Учитывая приведенные соображения, находим аі = V & — ё\ёо- 

Определяя теперь знаменатель в выражении для а из условия для градиента на пра- 
вом конце отрезка: 

За = —26 + & — д 0 

и выражая 6 через г: 


— 6 = г + с 


находим следующую последовательность действий для 
г = 3 (/о — /х) +41і + Цо т=\Рг 2 — §ід ч 

(предполагалось, что г 2 — > 0) . 
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вычисления а 

„ = _і+_ш±|о_ 
2 * + ёі + ёо 


В выражении для а знаменатель, равный За, обращается в нуль, т. е. 2г + ^ + 
+ 8о — 0 при снижении порядка интерполяционного полинома (при а — 0). Пре- 
образуем последнюю форму лу для а к виду, пригодному для вычислений при а = 0. 
Запишем выражение т = р Г 2 2 — 8і8о в виде (г + до) (г — до) = 8і8о- Далее последо- 
вательно находим: 


г + а> _ 8і 

8 о г — до 

г + ДО + 8а Во 
г — ш + 8і г — до 


г + го + 8о = г — до + & 

#0 2 — Ц) 

2г Ч~ -Ьй’о г — о; + Яо 

г — О) + 2 — 0) 


Поделив второе соотношение на четвертое, найдем: 

а _.. г + ДО + Зо 

22+21+^0 2 — 01 + ^0 

Умножим числитель и знаменатель последней дроби на (г -(- до — 8а) и воспользуемся 
тождеством 


(Р — Я + г) (р + — г) р 2 — (<? — г) 2 = р 2 — ф — г 2 + 2іуг 

После выполнения преобразований находим 

г + ш — 8 0 
2ш + 8і—8о 


Убедимся, что это выражение имеет смысл при а = 0, т. е. при снижении по- 
рядка интерполяционного многочлена (параболическая интерполяция). В этом слу- 
чае, как мы видели, 2г + 8і + 8о = 0 и из = За + 2Ь + с следует, что 2 Ь = 
= Яі — 8а- Интерполяционный многочлен имеет минимум лишь при Ь > 0, т. е. 
П Р И 8і — 8о > 0, а в этом случае 2 ѵо Ві — & >0и выражение для а имеет смысл. 
Когда 2до + 8і — &> = 0, то 8і ^ 8о и, если а Ф 0, то применима первая из найден- 
ных формул для а: 

г + т + Ва 
2г + 8і + 8о 

а при а — 0 из 8і ^ 8о следует, что 6^0, значит интерполяционный многочлен, 
построенный на основе имеющейся информации, минимума не имеет. В этом случае, 
а также при 

г * — 8і8а < 0 (6 а — Зас < 0) « < 0, а > 1 


целесообразно несколько увеличить шаг в данном направлении или (при 8і > 8а) 
прибегнуть к линейной экстраполяции по градиенту с ограничением величины шага. 

Если интерполяция выполняется на отрезке {0, у]. V > 1 (V < 1). то, произведя 
сжатие по осям х и у в у раз (растяжение в 1/у раз), перейдем к интерполяции на от. 
резке [0, 1]. При этом преобразовании / 0 , / ѵ уменьшаются в у раз (увеличиваются 
в 1/у раз), а 8а, Ву остаются неизменными. Выполняя затем обратное преобразование, 
получаем следующие формулы кубической интерполяции на отрезке [0, у]: 


3(/р — /у) 
V 


+ Ву + #о 


т = Ѵг * — Ву8а 


а I ш — г + 8ѵ 
V 2 Ш + 8у—8и 


В заключение следует отметить, что во избежание потери точности при расчетах 
на ЭВМ, вычисление до целесообразно выполнять по формуле 


— п Ѵ (тг)'- (&)(-$-) !*.!■ ІЛІ) 


ПРИЛОЖЕНИЕ 3. СИНТЕЗ СИСТЕМ РЕКТИФИКАЦИИ 
С РЕКУПЕРАЦИЕЙ ТЕПЛА 

Имеется ряд работ, посвященных этой проблеме [166]; здесь поставим более огра - 
ниченную задачу. Рассмотрим вначале задачу синтеза систем разделения (СР) без 
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связанных тепловых потоков (на примере четырехкомпонентной смеси, см. рис. 36); 
при этом будем исходить из следующих предположений: 1) ректификационные ко’- 
лонны (РК) обладают высокой разделительной способностью; 2) давление во всех 
колоннах постоянно; 3) потоки могут обмениваться теплом только один раз. В даль- 
нейшем для простоты изложения РК, соответствующую вершине А і, также обозна- 
чим через А [■ Поставим в соответствие вершинам первого типа двоичные переменные 
2 /ь определяемые следующим образом: 


{ 1, если схема содержит РК ЛІ 
О, в противном случае 


Не все из этих переменных являются независимыми. Действительно, если существует 
колонна А і, то существует и колонна Аі и т. д. Отсюда вытекают следующие соотно- 
шения 


2 32 2 43 г 12 2 23 г 24 г 37 “ 2 46 г 38 г 47 (П, 1) 

Поскольку в СР может быть только одна из колонн Л}, ЛТ АІ , выполняется соотно- 
шение 

2 и 4 г іг *Г 2 і.з — 1 (П, 2) 

Колонны Л^, ЛЗ и ЛЗ, Л^ могут присутствовать в СР в том и только в том случае, 
когда в ней имеются РК А\, А соответственно. Отсюда справедливы соотношения 

2 » Ш 2 31 4” 2 32 2 13 = 2 37 4“ 2 38 (П, 3) 

Обозначим через р^- минимальные затраты на РК. Как указывалось выше, 
эти величины могут быть подсчитаны отдельно при независимой оптимизации 
каждой колонны. Легко видеть, что задача оптимального синтеза СР формулируется 
следующим образом: найти минимум функции 

/Г<2) = (П,4) 

і, і 

При наличии ограничений (П, 1) — (П, 3) суммирование в формуле (П, 4) проводится 
по всем вершинам 1-го типа. Подставляя соотношения (П, 1), (П, 3) в функцию 
(П, 2), (П, 4) придем к следующей задаче: 

тіп [(Ри + Рзх + Ра) г 01 + (р п + Ра 4- Ра) г а + (Ри + р 8 8+ 
г Ч 

4" Ри) г і 2 4* (Ріа 4- Рзі 4- Ра) г 87 4- (Ра 4- Рзз 4* Ра) г 8в1 (П, 5) 
2 зі 4- г 32 4- г 12 4- г 3 , 4- г 38 = 1 

Решение этой задачи сводится к полному перебору, который может быть сокращен 
применением метода отсечения неперспективных вариантов (см. гл. VI). 

Рассмотрим теперь задачу синтеза СР с использованием связанных тепловых 
потоков. Пусть, как и в предыдущем случае, найдены оптимальные режимы для всех 
РК всех возможных СР данной смеси. После этого для каждой РК будут известны ее 
стоимость, а также тепловые нагрузки на холодильник и нагреватель. Обозначим 
через ріі стоимость РК без учета стоимостей холодильника и нагревателя. Сформу- 
лируем подзадачу синтеза теплообменной системы (ТС) в данном случае. Включим 
в множество холодных потоков 5 С возвращаемые части кубового продукта, а в мно- 
жество 5/, — потоки из верха колонн, соответствующих всем вершинам 1-го типа. 
Так, выходные потоки а и ЬсЛ колонны А\ попадут в совокупности 5/, и 5 С , соответ- 
ственно. Если поток является выходным, т. е. отбирается из верха (низа) колонн, 
на вход которых подается одна и та же смесь, то в соответствующее множество его 
заносят только один раз. Так, поток из верха колонны, содержащий одну компо- 
ненту Ь, присутствует на выходах колонн А\, Л$, в которые подается одна и та же 
смесь Ьс. В совокупность 5^ вносим только один из этих потоков, однако поток, 
содержащий одну компоненту Ь, выходящий из верха колонны Л^, вводим в совокѵц. 
ность 5/, отдельно, '' ' ' 
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Введем двоичные переменные х;у в подзадачу синтеза ТС [см. соотношение 
(VI, 62)]. Построим ( п X п) -матрицу назначений для совокупности потоков 5^ 
и 5 С , используя известные тепловые нагрузки на нагреватели и холодильники. 

Принципиальное отличие данной задачи синтеза ТС от рассмотренной выше 
состоит в следующем. В обычной задаче синтеза ТС все потоки, входящие в матрицу 
назначений, обязательно участвуют в теплообмене. В данном же случае заранее 
не известно, какая совокупность горячих и холодных потоков будет фактически уча- 
ствовать в теплообмене, поскольку заранее не известна структура СР. С другой 
стороны структура СР не может быть найдена без знания структуры ТС, стоимость 
которой составляет существенную часть стоимости всей СР. Например, потоки ЬсЛ 
и а могут быть использованы в подзадаче синтеза ТС, в том и только в том случае, 
когда в СР имеется РК Таким образом, необходимо найти условия, связывающие 
использование того или иного потока в подзадаче синтеза ТС с наличием или отсут- 
ствием этого потока в задаче синтеза СР. 

Рассмотрим некоторый поток с номером I из совокупности 5/,. Пусть этот поток 
является выходным, т. е. отбирается из верха т РК А р ‘, А р ‘,. . ., А р т. Тогда этот 

171 

поток может участвовать в теплообмене только в том случае, когда в СР присут- 
ствует одна из РК А р і, (і = 1, га). Это условие может быть записано следующим 
і 

образом: 

N т 

У, х 1к = 2 г Річі (П, 6) 

к=\ і=1 

Легко проверить (см. рис. 35), что в одной СР не может быть двух РК, которые бы 
давали один и тот же поток, поэтому из совокупности переменных = 1, т) 

только одна может стать равной единице, а остальные будут равны нулю. Следова- 
тельно, правая часть условия (П, 6) может быть равна только нулю или единице. 
Таким образом, если в СР присутствует одна из РК А р і(і = 1, га), то правая часть 

ч і 

условия (П, 6) будет равна единице, откуда следует, что одна из переменных 
(& = 1 , IV) равна единице, т. е. теплообмен потока I разрешен. Если в СР нет ни 
одной РК из совокупности А р і(і = 1, га), то правая часть условия (П, 6) будет 

І 

равна нулю и теплообмен этого потока с другими будет отсутствовать. 

Рассмотрим пример. Пусть поток с номером I из 5/, содержит одну компоненту Ь , 
которую получают разделением потока Ьс. Как поток с верха РК, он может по- 
явиться на выходе РК А\. Соотношения (П, 6) в данном случае примут вид 

N 

2 х 1к = 2зі + 2 46 
Л=1 

Соотношения (П, 6) должны быть выписаны для каждого горячего и холодного по- 
тока. Теперь задачу синтеза СР со связанными тепловыми потоками можно записать 
следующим образом: 

шіп (/ г(1, +Р (2) ) (П, 7) 

х а, г ч' 

где / г < 1 >, определяются по формулам (VI, 6), (П, 4), соответственно, а переменные 
г,-/, Хіі удовлетворяют соотношениям (П, 5) и всем соотношениям типа (П, 6). 

Заметим, что избавиться от допущения 3 можно так же, как и в обычной задаче 
синтеза ТС. Отказ от допущения 2 приведет к итерационной двухуровневой про- 
цедуре, первому уровню которой будет соответствовать решение задачи (П, 7), а вто- 
рому — изменение давлений в каждой РК. Отметим, что приведенная процедура 
не дает полного решения рассматриваемой задачи, поскольку коэффициенты рц, 
определялись на основе данных, не учитывающих взаимного влияния РК через 
связанные тепловые потоки. 
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